Транспонирование текстовых файлов

#text #notepad

#текст #Блокнот

Вопрос:

У меня есть более 20 000 записей, которые экспортируются из программы, которые выглядят следующим образом:

 Parent   : 000691195
CUSTNO   : 115225036-AD
COMPANY  : BROOK FURNITURE RENTAL
ADDRESS1 : 100 N FIELD DR
city     : LAKE FOREST
STATE    : IL
ZIP      : 600452580

Parent   : 000691195
CUSTNO   : 116952265-AD
COMPANY  : BROOK FURNITURE RENTAL
ADDRESS1 : 100 N FIELD DR STE 220
city     : LAKE FOREST
STATE    : IL
ZIP      : 600452598
  

Мне нужно перенести их в доступные столбцы и строки, но я понятия не имею, как заставить их работать из текстового файла. Я просмотрел некоторые ответы в разделе как заменить возврат каретки на запятую, но в последнем фрагменте данных НЕ должно быть запятой после него, чтобы указать конец строки, а некоторые поля ADDRESS1 в любом случае пусты.

Любая помощь будет оценена.

Комментарии:

1. Пожалуйста, отформатируйте данные

2. Извините, я не знаю, что вы имеете в виду под этим комментарием?

3. Я пытался добавить изображение, но мне пока не разрешено…

4. Обратите внимание на правой боковой панели: How to edit , How to format , когда вы делаете сообщение. Вы можете добавить 4 пробела в начале строки или выделить текст и нажать CTRL K

5. Это кажется сложной задачей, которую нужно выполнить в текстовом редакторе. Знаете ли вы какой-либо язык программирования, который вы могли бы использовать для написания сценария?

Ответ №1:

Вы можете выполнить эту задачу, написав небольшой скрипт, например, на perl. Perl разработан для работы с преобразованиями текста лучше, чем другие языки.

 Perl - Practical Extraction and Reporting Language
  

Если вы не знаете ни одного языка программирования. Вы можете нанять фрилансера, который может выполнить эту задачу в upwork.com или аналогичный сайт

Ответ №2:

Итак, я понял это — на самом деле это комбинация нескольких разных ответов здесь, в StackOverflow.

Сначала мне нужно было заменить ВСЕ возвраты каретки на «^», это позволило бы мне позже открыть файл с разделителями, не беспокоясь о запятых в названиях компаний.

Далее, где заканчивалась одна строка и начиналась следующая, был текст ^Parent, поэтому я заменил его на r nParent, и это дало мне каждую новую строку.

Наконец, я удалил всю постороннюю информацию «заголовка», и это оставило мне только те данные, которые мне были нужны.