Сравнение данных таблицы из разных расширений файлов(pdf и word) в python

#python #python-3.x #pandas #dataframe

Вопрос:

Можно ли сравнить таблицы из 2 разных расширений файлов в python? Для чтения таблицы из pdf-файла я использую tabula.

 from tabula import read_pdf,convert_into
import pandas as pd
df= read_pdf("F:/New folder/multiple table.pdf", pages='all')
print(df[0])#table 1 from page 1
print(df[1])#table 2 from page 1
 

Приведенный ниже код предназначен для чтения таблицы из файла word,

 import win32com.client as win32
word = win32.gencache.EnsureDispatch('Word.Application')
word.Visible = False 
doc = word.Documents.Open("F:/New folder/multiple table.docx")
 

Поскольку у панд есть функция read_csv, которую можно использовать для CSV, а не для pdf и word.

Комментарии:

1. Пожалуйста, отредактируйте вопрос, чтобы ограничить его конкретной проблемой с достаточной детализацией для определения адекватного ответа.