получение диапазона страниц с помощью PyPDF2

ProgramBox

получение диапазона страниц с помощью PyPDF2

Post author:admin
Запись опубликована:20 января, 2022
Post category:Вопросы по программированию

#python-3.x #pypdf2

Вопрос:

Я просто хочу получить конкретные страницы, скажем, от 5 до 10 из всего pdf-документа, как это сделать ? ниже приведен код, который я пытаюсь … в настоящее время он ищет весь документ, чтобы найти 5-значный номер

 import PyPDF2
from PyPDF2 import PageRange
import re

f = open('cross.pdf', 'rb')

pdf = PyPDF2.PdfFileReader(f)

print(pdf.numPages)


#find the phone number
pattern = r'd{5}'



#get all the text so that you know whats the pattern of the phone numbers
all_text = ''
for n in range(pdf.numPages):
  page = pdf.getPage(0)


  page_text = page.extractText()

  all_text = all_text   ' '  page_text

print(all_text)`enter code here`


#check the match
for match in re.finditer(pattern, all_text):
  print(match)

Метки: получение диапазона страниц с помощью PyPDF2

Вопрос:

Вам также может понравиться

Как сканировать все доступные файлы SCSS и анализировать комментарии для создания информации в массив?

Обновлять EditText после нажатия кнопки

Как переопределить методы добавления полей Django многие ко многим () и удаления ()