#python #pandas #csv #csvreader
#python #pandas #csv #csvreader
Вопрос:
У меня серьезная проблема с моим файлом CSV, может ли кто-нибудь предложить возможное решение python для моей проблемы?
В моем CSV-файле текстовый столбец «примечания» создает несколько новых строк и добавляется к следующей строке, существенно нарушая порядок строк. Я попытался прочитать его как текст, разделить его по новой строке и разделителю, но это сложно, потому что новые строки, созданные из «замечаний», различаются по порядку.
Я прикрепил ниже образец файла CSV ниже для вашей справки, он в формате txt, чтобы вы могли лучше понимать форматы разделителей, ваши данные будут благодарны.
Текущий файл
key1tkey2tremarkstdate_createdtprogram_typen
1910-ASD3tT342-1AE2tJohan has applied forn
this program on 2020-03-13, good application etc.tprogram_An
9572-45A3t823A-1T3CtMary has applied for this programn
on 2019-03-13, she has doubts about this programn
so she switched her program on 2019-04-13 etc.tprogram_Bn
842E-123At343D-6TYBttnot enrolledn
Желаемый результат
key1tkey2tremarkstdate_createdtprogram_typen
1910-ASD3tT342-1AE2tJohan has applied for this program on 2020-03-13, good application etc.tprogram_An
9572-45A3t823A-1T3CtMary has applied for this program on 2019-03-13, she has doubts about this program so she switched her program on 2019-04-13 etc.tprogram_Bn
842E-123At343D-6TYBttnot enrolledn
Комментарии:
1. это сложно, потому что количество строк, на которые он может быть разделен, кажется разным. можете ли вы получить другой формат от вышестоящего производителя данных? если да, я бы попросил использовать в этом файле новый разделитель, которого нет
n
2. спасибо за быстрый ответ, в предыдущих файлах замечания были удалены из-за этой проблемы, но был запрос пользователя показать столбец замечаний для их повседневной работы. Если вы знаете обходной путь, дайте мне знать, спасибо! Одна мысль, которую я имел в виду, заключалась в том, чтобы вставить кавычки в столбец «примечания», но я не уверен в подходе
3. попросите создать файл с использованием другого разделителя, отличного от
n
. это решение простое и избавит вас от любых споров