Как мне сохранить одну страницу из PDF в виде отдельного файла в Python?

#python

Вопрос:

Приведенный ниже код разбивает страницы в файле PDF на несколько файлов PDF. Однако я хочу, чтобы разделялась только вторая страница из каждого файла.

 import os
from glob import glob
from PyPDF2 import PdfFileWriter, PdfFileReader
def splitPDF(file_name,output_dir=None):
    inputpdf = PdfFileReader(open(file_name , "rb"))
    num_pages = inputpdf.numPages
    for i in range(num_pages):
        output = PdfFileWriter()
        output.addPage(inputpdf.getPage(i))
        output_name = f"{os.path.basename(file_name.replace('.pdf',''))}{i 1}.pdf"
        if output_dir is None:
            output_name = os.path.join(output_dir, output_name)
        with open(output_name,'wb') as outputStream:
            output.write(outputStream)
    print(f"PDF: {file_name} has been splitted")
base_dir = r"path where the pdf files are stored in folder"
output_dir = r"path where i want to extract the file"
pdfs = os.path.join(base_dir,"*.pdf")
files = glob(pdfs)
for file in files:
    splitPDF(file,output_dir)

Может ли кто-нибудь решить эту проблему? Я действительно ценю вашу помощь!

1. Этот код был взят из Stackoverflow, просто нужны некоторые разъяснения и обновления по тому же

2. Просто добавьте if condition внутри цикла: например if i == 2:

3. Вы имеете в виду output.addPage(inputpdf.getPage(1)) ? Нет необходимости в цикле…

4. Привет, это сработало. Спасибо. Но почему я не могу сохранить файл в output_dir. Как будто он извлекается только в base_dir

Вопрос:

Комментарии:

Вам также может понравиться

Переопределение стиля поля сохраненного пароля в Google Chrome

jQuery — редактирование вновь созданного div с jEditable не работает

сбой зависимостей heroku