#python
#python
Вопрос:
Приведенный ниже код разбивает страницы в файле PDF на несколько файлов PDF. Однако я хочу, чтобы разделялась только вторая страница из каждого файла.
import os
from glob import glob
from PyPDF2 import PdfFileWriter, PdfFileReader
def splitPDF(file_name,output_dir=None):
inputpdf = PdfFileReader(open(file_name , "rb"))
num_pages = inputpdf.numPages
for i in range(num_pages):
output = PdfFileWriter()
output.addPage(inputpdf.getPage(i))
output_name = f"{os.path.basename(file_name.replace('.pdf',''))}{i 1}.pdf"
if output_dir is None:
output_name = os.path.join(output_dir, output_name)
with open(output_name,'wb') as outputStream:
output.write(outputStream)
print(f"PDF: {file_name} has been splitted")
base_dir = r"path where the pdf files are stored in folder"
output_dir = r"path where i want to extract the file"
pdfs = os.path.join(base_dir,"*.pdf")
files = glob(pdfs)
for file in files:
splitPDF(file,output_dir)
Может ли кто-нибудь решить эту проблему? Я действительно ценю вашу помощь!
Комментарии:
1. Этот код был взят из Stackoverflow, просто нужны некоторые разъяснения и обновления по тому же
2. Просто добавьте
if condition
внутри цикла: напримерif i == 2:
3. Вы имеете в виду
output.addPage(inputpdf.getPage(1))
? Нет необходимости в цикле…4. Привет, это сработало. Спасибо. Но почему я не могу сохранить файл в output_dir. Как будто он извлекается только в base_dir