PDFBox объединяет два pdf-файла бок о бок, оптимизируя дисковое пространство

#java #pdfbox

#java #pdfbox

Вопрос:

Я использую PDFBox для объединения двух PDF-файлов бок о бок.
Я использую следующий код:

 PDDocument outDoc = new PDDocument();

int maxPages = targetDoc.getNumberOfPages();
if (sourceDoc.getNumberOfPages() > targetDoc.getNumberOfPages()) {
    maxPages = sourceDoc.getNumberOfPages();
}
PDPage sourceIndexPage;
PDPage targetIndexPage;
PDRectangle pdf1Frame;
PDRectangle pdf2Frame;
PDRectangle outPdfFrame;
COSDictionary dict;
PDPage outPdfPage;
LayerUtility layerUtility;
PDFormXObject sourceFormPDF;
PDFormXObject targetFormPDF;
AffineTransform afLeft;
AffineTransform afRight;

for (int indexPage = 0; indexPage < maxPages; indexPage  ) {

    // Create output PDF frame
    try {
        sourceIndexPage = sourceDoc.getPage(indexPage);
    } catch (IndexOutOfBoundsException error) {
        sourceDoc.addPage(new PDPage());
        sourceIndexPage = targetDoc.getPage(indexPage);
    }

    try {
        targetIndexPage = targetDoc.getPage(indexPage);
    } catch (IndexOutOfBoundsException error) {
        targetDoc.addPage(new PDPage());
        targetIndexPage = targetDoc.getPage(indexPage);
    }

    sourceIndexPage.setRotation(0);
    targetIndexPage.setRotation(0);

    pdf1Frame = sourceIndexPage.getCropBox();
    pdf2Frame = targetIndexPage.getCropBox();
    outPdfFrame = new PDRectangle(pdf1Frame.getWidth()   pdf2Frame.getWidth(),
            Math.max(pdf1Frame.getHeight(), pdf2Frame.getHeight()));

    // Create output page with calculated frame and add it to the document
    dict = new COSDictionary();
    dict.setItem(COSName.TYPE, COSName.PAGE);
    dict.setItem(COSName.MEDIA_BOX, outPdfFrame);
    dict.setItem(COSName.CROP_BOX, outPdfFrame);
    dict.setItem(COSName.ART_BOX, outPdfFrame);
    outPdfPage = new PDPage(dict);
    outDoc.addPage(outPdfPage);

    // Source PDF pages has to be imported as form XObjects to be able to insert them at a specific point in the output page
    // pageNumber
    layerUtility = new LayerUtility(outDoc);
    sourceFormPDF = layerUtility.importPageAsForm(sourceDoc, indexPage);
    targetFormPDF = layerUtility.importPageAsForm(targetDoc, indexPage);

    // Add form objects to output page
    afLeft = new AffineTransform();
    layerUtility.appendFormAsLayer(outPdfPage, sourceFormPDF, afLeft, "left "   indexPage);
    afRight = AffineTransform.getTranslateInstance(pdf1Frame.getWidth(), 0.0);
    layerUtility.appendFormAsLayer(outPdfPage, targetFormPDF, afRight, "right"   indexPage);
}

outDoc.save("oudDoc.pdf");
 

Проблема, с которой я сталкиваюсь, заключается в том, что для некоторых документов размер outDoc слишком велик. Я ожидал, что это будет что-то вроде dim исходного документа dim целевого документа, но на самом деле это в 10 раз, в 20 раз больше.

Заглядывая в структуру документа, я заметил, что я повторяю общие ресурсы, которые в исходных PDF-файлах были разделены. Есть ли способ сжать / оптимизировать мой код, чтобы на диске было меньше места?

Ответ №1:

Мы решили проблему, обработав созданный PDF-файл с помощью ghostscript