#text #notepad
#текст #Блокнот
Вопрос:
У меня есть более 20 000 записей, которые экспортируются из программы, которые выглядят следующим образом:
Parent : 000691195
CUSTNO : 115225036-AD
COMPANY : BROOK FURNITURE RENTAL
ADDRESS1 : 100 N FIELD DR
city : LAKE FOREST
STATE : IL
ZIP : 600452580
Parent : 000691195
CUSTNO : 116952265-AD
COMPANY : BROOK FURNITURE RENTAL
ADDRESS1 : 100 N FIELD DR STE 220
city : LAKE FOREST
STATE : IL
ZIP : 600452598
Мне нужно перенести их в доступные столбцы и строки, но я понятия не имею, как заставить их работать из текстового файла. Я просмотрел некоторые ответы в разделе как заменить возврат каретки на запятую, но в последнем фрагменте данных НЕ должно быть запятой после него, чтобы указать конец строки, а некоторые поля ADDRESS1 в любом случае пусты.
Любая помощь будет оценена.
Комментарии:
1. Пожалуйста, отформатируйте данные
2. Извините, я не знаю, что вы имеете в виду под этим комментарием?
3. Я пытался добавить изображение, но мне пока не разрешено…
4. Обратите внимание на правой боковой панели:
How to edit
,How to format
, когда вы делаете сообщение. Вы можете добавить 4 пробела в начале строки или выделить текст и нажатьCTRL K
5. Это кажется сложной задачей, которую нужно выполнить в текстовом редакторе. Знаете ли вы какой-либо язык программирования, который вы могли бы использовать для написания сценария?
Ответ №1:
Вы можете выполнить эту задачу, написав небольшой скрипт, например, на perl. Perl разработан для работы с преобразованиями текста лучше, чем другие языки.
Perl - Practical Extraction and Reporting Language
Если вы не знаете ни одного языка программирования. Вы можете нанять фрилансера, который может выполнить эту задачу в upwork.com или аналогичный сайт
Ответ №2:
Итак, я понял это — на самом деле это комбинация нескольких разных ответов здесь, в StackOverflow.
Сначала мне нужно было заменить ВСЕ возвраты каретки на «^», это позволило бы мне позже открыть файл с разделителями, не беспокоясь о запятых в названиях компаний.
Далее, где заканчивалась одна строка и начиналась следующая, был текст ^Parent, поэтому я заменил его на r nParent, и это дало мне каждую новую строку.
Наконец, я удалил всю постороннюю информацию «заголовка», и это оставило мне только те данные, которые мне были нужны.