#pandas #tabula-py
#pandas #tabula-py
Вопрос:
У меня есть файл PDF, в котором есть несколько таблиц, например: Таблица из файла PDF
Кстати, я узнал, что мне нужно использовать tabula-py из Java (Примечание: я работаю над Jupyter Notebook, поэтому я кодирую это: импортировать pandas как pd, импортировать numpy как np
импорт tabula из tabula импорт read_pdf
pdf_path = «..PDF pobreza2.pdf» #Направление файла
df=tabula.read_pdf(pdf_path, pages=»все», stream= True, guess= False, multiple_tables = True) #В PDF много страниц с несколькими таблицами
И я получаю это: вывод кода
Это похоже на список, а не на фрейм данных
Итак, как я могу преобразовать эту таблицу в фрейм данных? Таблицы имеют строковый и плавающий объект