Как конвертировать PDF в Excel с помощью tabula-py в фрейм данных из нескольких таблиц?

#pandas #tabula-py

#pandas #tabula-py

Вопрос:

У меня есть файл PDF, в котором есть несколько таблиц, например: Таблица из файла PDF

Кстати, я узнал, что мне нужно использовать tabula-py из Java (Примечание: я работаю над Jupyter Notebook, поэтому я кодирую это: импортировать pandas как pd, импортировать numpy как np

импорт tabula из tabula импорт read_pdf

pdf_path = «..PDF pobreza2.pdf» #Направление файла

df=tabula.read_pdf(pdf_path, pages=»все», stream= True, guess= False, multiple_tables = True) #В PDF много страниц с несколькими таблицами

И я получаю это: вывод кода

Это похоже на список, а не на фрейм данных

Итак, как я могу преобразовать эту таблицу в фрейм данных? Таблицы имеют строковый и плавающий объект