#python #excel #pandas #openpyxl
#питон #превосходить #панды #openpyxl
Вопрос:
Я пытаюсь прочитать файл excel, который относительно большой (30 МБ), лист, который я пытаюсь загрузить, openpyxl
содержит около 200 тыс. строк. В другие разы я пытался читать большие файлы с openpyxl
пандами или с ними, и проблем не возникало., но на этот раз файл не загружается. Я запустил код, и через 49 минут он все еще загружается.
Другие листы, содержащиеся в excel, содержат только сводные таблицы. Сводные таблицы, похоже, являются проблемой, потому что я изменил их на простые таблицы и теперь openpyxl
загружает файл всего за 30 секунд. Однако мне нужно сохранить сводные таблицы, есть ли способ указать openpyxl
, чтобы игнорировать листы, на которых есть сводные таблицы, при загрузке основного листа? или есть какая-либо конфигурация, позволяющая избежать этой проблемы?
Примечание: Я знаю, что мы можем указать лист для чтения при загрузке книги, но даже с этой опцией проблема та же.
from openpyxl import load_workbook db_wb = load_workbook('C:\UsersmyUser\Desktop\database.xlsx') print(db_wb.sheetnames) db_sh = db_wb['main-sheet']
Мне нужно загрузить рабочую книгу , чтобы добавить данные в 'main-sheet'
нее, но сохранить оставшиеся листы. Может быть, есть способ игнорировать оставшиеся листы при чтении main-sheet
это мой список листов:
['summary, 'main-sheet', 'table 1', 'table 2', 'table 3', 'table 4','table 5', 'table 6']