Символ новой строки в файле pdf, записываемый в следующую строку в python

#python

Вопрос:

Я попытался прочитать файл pdf как исходный в скрипте Python и преобразовал в текстовый файл / формат, но для каждой строки, считываемой из pdf, последний символ (столбец CAT) переносится на следующую строку. Как это можно обработать, чтобы данные преобразовывались КАК ЕСТЬ из pdf в текст.

Исходный файл «PDF»: Описание КОДА CAT 0011 ТЕСТОВЫЕ ДАННЫЕ ABC P 0012 Данные SAMP EFG C

Преобразованные данные в «Текст»: 0011TEST DATA ABC P0012SAMP Data EFG

1. Ниже приведен фрагмент кода, но последний символ печатается в следующей строке: импорт PyPDF2 импорт коллекций def main(): pdfFile = open(«file.pdf», ‘rb’) pdfRead = PyPDF2.PdfFileReader(pdfFile) number_of_pages = pdfRead.getNumPages() c = коллекции. Счетчик (диапазон (number_of_pages)) для i в c: page = pdfRead.getPage(i) page_content = page.extractText() печать (page_content), если имя__== «__main «: main()

2. Может кто-нибудь, пожалуйста, помочь в этом.

Вопрос:

Комментарии:

Вам также может понравиться

Не удается установить драйвер с помощью printui. Это потому, что срок действия сертификата драйвера истек?

Преобразовать диаграмму силы D3 в v4

Ошибка установки Rubocop: не удалось собрать драгоценные камни