#python #pymupdf
#python #pymupdf
Вопрос:
У меня есть документ PDF, и на этой странице есть изображение графика, однако легенда графика не является частью изображения. Я использую pymupdf для извлечения и получения этого изображения следующим образом:
for img in doc.getPageImageList(page_num, full=True):
xref = img[0]
pix = fitz.Pixmap(doc, xref)
if pix.n - pix.alpha < 4: # this is GRAY or RGB
pix.writePNG(basePath "/test_data/" fund_type "/%s-%s.png" % (filename str(page_num), xref))
print(filename ' : ' basePath "/test_data/" fund_type '/' filename str(page_num) '-' str(xref), file=f)
Теперь это дает мне изображение (график). Я хочу иметь возможность захватывать некоторую высоту под изображением, чтобы легенда сюжета также отображалась как часть изображения.
Возможно ли это с помощью pymupdf? Также были бы полезны любые указатели на код.
Комментарии:
1.
Page.getText("dict")
может быть опция, которая возвращает блоки изображения с координатами. Что вы можете сделать дальше, так это использоватьImage
для обрезки изображения с легендой и координатами. Одна вещь, в которой я не уверен, заключается в том, содержит ли эти блоки изображения легенду в соответствии с вашими требованиями, но это вариант. [ pymupdf.readthedocs.io/en/latest/faq.html ]