#python #pdf #pymupdf
#python #PDF #pymupdf
Вопрос:
У меня есть документ PDF, и для простоты я хочу создать две (много) разных отредактированных версии одного и того же PDF-файла.
Например, в одном из PDF-файлов я хочу, чтобы все «и» в PDF-файле были выделены, а во втором я хочу, чтобы все «the» были выделены.
Я попытался сделать это так, используя PyMuPDF:
import fitz
pdf = "mypdf.pdf"
doc = fitz.open(pdf)
text = ["and"]
for j in text:
i = page.searchFor(j)
for inst in i:
highlight = page.addHighlightAnnot(inst)
doc.save("output_and.pdf", garbage=4, deflate=True, clean=True)
text = ["the"]
for j in text:
i = page.searchFor(j)
for inst in i:
highlight = page.addHighlightAnnot(inst)
doc.save("output_the.pdf", garbage=4, deflate=True, clean=True)
Здесь первый файл (output_and.pdf) имеет содержимое, как и ожидалось, но во втором файле (output_the.pdf) выделены «и» и «the». Есть ли способ отключить подсветку «и», а затем сохранить файл таким образом, чтобы это не повлияло на следующий раз, когда я сохраню PDF.
Комментарии:
1. попробуйте снова открыть файл с помощью
fitz.open(pdf)
, прежде чем выделять другое слово.2. О да, это решило мою проблему. Единственное, что мне придется повторить на «странице». Большое спасибо