есть ли способ прочитать файл excel с помощью openpyxl и игнорировать листы, содержащие сводные таблицы?

#python #excel #pandas #openpyxl

#питон #превосходить #панды #openpyxl

Вопрос:

Я пытаюсь прочитать файл excel, который относительно большой (30 МБ), лист, который я пытаюсь загрузить, openpyxl содержит около 200 тыс. строк. В другие разы я пытался читать большие файлы с openpyxl пандами или с ними, и проблем не возникало., но на этот раз файл не загружается. Я запустил код, и через 49 минут он все еще загружается.

Другие листы, содержащиеся в excel, содержат только сводные таблицы. Сводные таблицы, похоже, являются проблемой, потому что я изменил их на простые таблицы и теперь openpyxl загружает файл всего за 30 секунд. Однако мне нужно сохранить сводные таблицы, есть ли способ указать openpyxl , чтобы игнорировать листы, на которых есть сводные таблицы, при загрузке основного листа? или есть какая-либо конфигурация, позволяющая избежать этой проблемы?

Примечание: Я знаю, что мы можем указать лист для чтения при загрузке книги, но даже с этой опцией проблема та же.

 from openpyxl import load_workbook  db_wb = load_workbook('C:\UsersmyUser\Desktop\database.xlsx') print(db_wb.sheetnames) db_sh = db_wb['main-sheet']  

Мне нужно загрузить рабочую книгу , чтобы добавить данные в 'main-sheet' нее, но сохранить оставшиеся листы. Может быть, есть способ игнорировать оставшиеся листы при чтении main-sheet

это мой список листов:

 ['summary, 'main-sheet', 'table 1', 'table 2', 'table 3', 'table 4','table 5', 'table 6']