Чтение таблиц из PDF на Python

#pdf #tabula

#PDF #tabula

Вопрос:

У меня есть PDF-файл, содержащий таблицу числовых значений. Я намерен прочитать эту таблицу в Python (в записной книжке Jupyter). Для этой цели я называю пакет tabula. Код, который я написал, выглядит следующим образом:

 import tabula as tb df = tb.read_pdf("file.pdf", pages=1,output_format="dataframe")  

Когда я печатаю df, все записи в таблице отображаются как NaN. Есть ли что-нибудь, чего мне не хватает?

Комментарии:

1. Пожалуйста, поделитесь PDF-файлами, чтобы посмотреть дальше, если вы не можете поделиться здесь, пожалуйста, поделитесь некоторыми из них на моем идентификаторе электронной почты, если вы не возражаете.