#python #data-structures
Вопрос:
Я пытался создать скрипт, который просматривает и объединяет CSV-файлы в папку, вычисляет средние значения по определенным столбцам и экспортирует результаты в один файл. До сих пор мне удавалось создать логику для этого сейчас, но я борюсь с идентификацией для каждого столбца в результирующем CSV, эти столбцы должны быть названы в честь 3 файлов, которые были усреднены. Я перечислил файлы в текущем каталоге , используя glob
, все файлы названы по шаблону:
AA_XXXX-b
.
Где AA
-номер образца, а b
также повторение (1-2 для дубликатов, 1-3 для тройных и т. Д.) и XXXX
краткое описание образца. Я подумал о том, чтобы использовать список, сгенерированный при перечислении файлов, и каким-то образом объединить все повторения образца в один элемент с таким форматом, как:
AA_XXXX_1-N
,
Где N-количество повторений, и сохраните объединенные имена в списке, чтобы использовать его для именования столбцов со средними значениями в конечном файле, но не смог придумать или найти ничего подобного. Я приношу извинения, если этот вопрос уже был задан.
Редактировать:
Вот пример того, что я пытаюсь сделать: вот как выглядят данные в отдельных CSV-файлах:
Имя файла: 01_NoCons-1 | брюшной пресс |
---|---|
Длина волны (нм) | 0 |
901.5391 | 0.523718 |
902.8409 | 0.516127 |
905.4431 | 0.521074 |
908.0434 | 0.516442 |
909.3429 | 0.510993 |
Имя файла: 01_NoCons-2 | брюшной пресс |
---|---|
Длина волны (нм) | 0 |
901.5391 | 0.523718 |
902.8409 | 0.516127 |
905.4431 | 0.521074 |
908.0434 | 0.516442 |
909.3429 | 0.510993 |
Имя файла: 01_NoCons — 3 | брюшной пресс |
---|---|
Длина волны (нм) | 0 |
901.5391 | 0.523718 |
902.8409 | 0.516127 |
905.4431 | 0.521074 |
908.0434 | 0.516442 |
909.3429 | 0.510993 |
И после объединения и вычисления среднего значения по 3 abs
столбцам результат переносится в новую таблицу, уже содержащую Wavelenght
столбец, например:
Имя файла: Итоговая таблица | 01_NoCons_1-3 |
---|---|
Длина волны (нм) | 0 |
901.5391 | 0.523718 |
902.8409 | 0.516127 |
905.4431 | 0.521074 |
908.0434 | 0.516442 |
909.3429 | 0.510993 |
Этот процесс повторяется для каждого набора повторений выборки, и я хотел бы, чтобы полученное имя столбца указывало , из какого набора оно было сгенерировано, например 01_NoCons_1-3
, что указывает на то, что столбец является результатом среднего числа повторений от 1 до 3 в выборке 01_NoCons
Комментарии:
1. Трудно понять, что вы пытаетесь сделать, просто прочитав ваше описание. Не могли бы вы, пожалуйста, привести пример содержимого файлов (возможно, ограничившись 3 файлами и 5 строками на файл, так как нам не нужно заполнять файлы, чтобы понять).
2. Конечно, я включу больше информации в описание