Захват скриншота со страницы pdf

#python #pymupdf

#python #pymupdf

Вопрос:

У меня есть документ PDF, и на этой странице есть изображение графика, однако легенда графика не является частью изображения. Я использую pymupdf для извлечения и получения этого изображения следующим образом:

   for img in doc.getPageImageList(page_num, full=True):
    xref = img[0]
    pix = fitz.Pixmap(doc, xref)
    if pix.n - pix.alpha < 4:  # this is GRAY or RGB
      pix.writePNG(basePath "/test_data/" fund_type "/%s-%s.png" % (filename str(page_num), xref))
      print(filename   ' : '   basePath   "/test_data/"   fund_type  '/' filename  str(page_num)   '-' str(xref), file=f)
  

Теперь это дает мне изображение (график). Я хочу иметь возможность захватывать некоторую высоту под изображением, чтобы легенда сюжета также отображалась как часть изображения.
Возможно ли это с помощью pymupdf? Также были бы полезны любые указатели на код.

Комментарии:

1. Page.getText("dict") может быть опция, которая возвращает блоки изображения с координатами. Что вы можете сделать дальше, так это использовать Image для обрезки изображения с легендой и координатами. Одна вещь, в которой я не уверен, заключается в том, содержит ли эти блоки изображения легенду в соответствии с вашими требованиями, но это вариант. [ pymupdf.readthedocs.io/en/latest/faq.html ]