Как сохранить разные версии одного PDF-файла с разными выделениями, PyMuPDF, Python?

#python #pdf #pymupdf

#python #PDF #pymupdf

Вопрос:

У меня есть документ PDF, и для простоты я хочу создать две (много) разных отредактированных версии одного и того же PDF-файла.

Например, в одном из PDF-файлов я хочу, чтобы все «и» в PDF-файле были выделены, а во втором я хочу, чтобы все «the» были выделены.

Я попытался сделать это так, используя PyMuPDF:

 import fitz
pdf = "mypdf.pdf"
doc = fitz.open(pdf)

text = ["and"]
for j in text:
    i = page.searchFor(j)
     for inst in i:
        highlight = page.addHighlightAnnot(inst)
doc.save("output_and.pdf", garbage=4, deflate=True, clean=True)

text = ["the"]
for j in text:
    i = page.searchFor(j)
    for inst in i:
        highlight = page.addHighlightAnnot(inst)
doc.save("output_the.pdf", garbage=4, deflate=True, clean=True)
  

Здесь первый файл (output_and.pdf) имеет содержимое, как и ожидалось, но во втором файле (output_the.pdf) выделены «и» и «the». Есть ли способ отключить подсветку «и», а затем сохранить файл таким образом, чтобы это не повлияло на следующий раз, когда я сохраню PDF.

Комментарии:

1. попробуйте снова открыть файл с помощью fitz.open(pdf) , прежде чем выделять другое слово.

2. О да, это решило мою проблему. Единственное, что мне придется повторить на «странице». Большое спасибо