#python-3.x #pypdf2
Вопрос:
Я просто хочу получить конкретные страницы, скажем, от 5 до 10 из всего pdf-документа, как это сделать ? ниже приведен код, который я пытаюсь … в настоящее время он ищет весь документ, чтобы найти 5-значный номер
import PyPDF2
from PyPDF2 import PageRange
import re
f = open('cross.pdf', 'rb')
pdf = PyPDF2.PdfFileReader(f)
print(pdf.numPages)
#find the phone number
pattern = r'd{5}'
#get all the text so that you know whats the pattern of the phone numbers
all_text = ''
for n in range(pdf.numPages):
page = pdf.getPage(0)
page_text = page.extractText()
all_text = all_text ' ' page_text
print(all_text)`enter code here`
#check the match
for match in re.finditer(pattern, all_text):
print(match)