Есть ли способ для textract отображать изображения PDF в таблицах данных Excel?

#ocr

#ocr

Вопрос:

У меня есть PDF-файл таблицы данных, но это всего лишь изображение. это означает, что я не могу скопировать и вставить значение из него, и OCR недоступен. Есть ли способ использовать textract (или какой-либо другой сервис), чтобы получить таблицу данных в Excel?

Ответ №1:

Вы можете использовать textract для части этого, но нет способа хорошо структурировать результаты. Например, вы можете составить один длинный список текстовых блоков, содержащих «строку», но вам понадобится способ структурировать их аналогично тому, как они были структурированы в исходной таблице данных из PDF. Эта последняя часть, в частности, делает эту проблему довольно сложной.