Символ новой строки в файле pdf, записываемый в следующую строку в python

#python

#python

Вопрос:

Я попытался прочитать файл pdf как исходный в скрипте Python и преобразовал в текстовый файл / формат, но для каждой строки, считываемой из pdf, последний символ (столбец CAT) переносится на следующую строку. Как это можно обработать, чтобы данные преобразовывались КАК ЕСТЬ из pdf в текст.

Исходный файл «PDF»: Описание КОДА CAT 0011 ТЕСТОВЫЕ ДАННЫЕ ABC P 0012 Данные SAMP EFG C

Преобразованные данные в «Текст»: 0011TEST DATA ABC P0012SAMP Data EFG

Комментарии:

1. Ниже приведен фрагмент кода, но последний символ печатается в следующей строке: импорт PyPDF2 импорт коллекций def main(): pdfFile = open(«file.pdf», ‘rb’) pdfRead = PyPDF2.PdfFileReader(pdfFile) number_of_pages = pdfRead.getNumPages() c = коллекции. Счетчик (диапазон (number_of_pages)) для i в c: page = pdfRead.getPage(i) page_content = page.extractText() печать (page_content), если имя__== «__main «: main()

2. Может кто-нибудь, пожалуйста, помочь в этом.