Объединить последовательные повторы имен файлов в списке

#python #data-structures

Вопрос:

Я пытался создать скрипт, который просматривает и объединяет CSV-файлы в папку, вычисляет средние значения по определенным столбцам и экспортирует результаты в один файл. До сих пор мне удавалось создать логику для этого сейчас, но я борюсь с идентификацией для каждого столбца в результирующем CSV, эти столбцы должны быть названы в честь 3 файлов, которые были усреднены. Я перечислил файлы в текущем каталоге , используя glob , все файлы названы по шаблону:

AA_XXXX-b .

Где AA -номер образца, а b также повторение (1-2 для дубликатов, 1-3 для тройных и т. Д.) и XXXX краткое описание образца. Я подумал о том, чтобы использовать список, сгенерированный при перечислении файлов, и каким-то образом объединить все повторения образца в один элемент с таким форматом, как:

AA_XXXX_1-N ,

Где N-количество повторений, и сохраните объединенные имена в списке, чтобы использовать его для именования столбцов со средними значениями в конечном файле, но не смог придумать или найти ничего подобного. Я приношу извинения, если этот вопрос уже был задан.

Редактировать:

Вот пример того, что я пытаюсь сделать: вот как выглядят данные в отдельных CSV-файлах:

Имя файла: 01_NoCons-1 брюшной пресс
Длина волны (нм) 0
901.5391 0.523718
902.8409 0.516127
905.4431 0.521074
908.0434 0.516442
909.3429 0.510993
Имя файла: 01_NoCons-2 брюшной пресс
Длина волны (нм) 0
901.5391 0.523718
902.8409 0.516127
905.4431 0.521074
908.0434 0.516442
909.3429 0.510993
Имя файла: 01_NoCons — 3 брюшной пресс
Длина волны (нм) 0
901.5391 0.523718
902.8409 0.516127
905.4431 0.521074
908.0434 0.516442
909.3429 0.510993

И после объединения и вычисления среднего значения по 3 abs столбцам результат переносится в новую таблицу, уже содержащую Wavelenght столбец, например:

Имя файла: Итоговая таблица 01_NoCons_1-3
Длина волны (нм) 0
901.5391 0.523718
902.8409 0.516127
905.4431 0.521074
908.0434 0.516442
909.3429 0.510993

Этот процесс повторяется для каждого набора повторений выборки, и я хотел бы, чтобы полученное имя столбца указывало , из какого набора оно было сгенерировано, например 01_NoCons_1-3 , что указывает на то, что столбец является результатом среднего числа повторений от 1 до 3 в выборке 01_NoCons

Комментарии:

1. Трудно понять, что вы пытаетесь сделать, просто прочитав ваше описание. Не могли бы вы, пожалуйста, привести пример содержимого файлов (возможно, ограничившись 3 файлами и 5 строками на файл, так как нам не нужно заполнять файлы, чтобы понять).

2. Конечно, я включу больше информации в описание