#python #python-3.x #pdf #jpeg
Вопрос:
Я пытаюсь создать скрипт на Python, который обрезает pdf-файл из timbox в pdf-файле и сохраняет результат в виде *.jpg-файла.
Мне удается обрезать pdf-файл (файл result.pdf обрезан), но когда я сохраняю его в формате *.jpg, он не обрезан (того же размера, что и test.pdf). Кроме того, я думаю, что должен быть какой-то лучший способ, чем то, что я пытаюсь сделать, сначала обрезать и сохранить pdf-файл в файл, а затем преобразовать обрезанный pdf в jpg. Можно ли конвертировать в jpg без предварительного сохранения обработанного pdf-файла в виде файла?
from PyPDF4 import PdfFileWriter, PdfFileReader
input = PdfFileReader(open("test.pdf","rb"))
output = PdfFileWriter()
page = input.getPage(0)
trimboxUpperLeft = page.trimBox.getUpperLeft()
trimboxLowerRight = page.trimBox.getLowerRight()
n = input.getNumPages()
for i in range(n):
page = input.getPage(i)
page.cropBox.upperLeft = (trimboxUpperLeft)
page.cropBox.lowerRight = (trimboxLowerRight)
output.addPage(page)
outputStream = open('result.pdf','wb')
output.write(outputStream)
outputStream.close()
from pdf2image import convert_from_path
images = convert_from_path('result.pdf')
for i in range(len(images)):
images[i].save('Output_' str(i) '.jpg', 'JPEG')