Программное преобразование файлов Doc (x) в PDF с помощью Microsoft Word

#ms-word #pdf #java #docx

#ms-word #PDF #java #docx

Вопрос:

Мы разрабатываем Java-приложение, которому необходимо программно конвертировать файлы .rtf, .doc и .docx в файлы PDF.

Для нас важно форматирование, поэтому нам нужно, чтобы номера страниц в исходном и целевом файлах PDF были одинаковыми, а содержимое каждой страницы совпадало с исходным файлом.

Мы опробовали решения с открытым исходным кодом, такие как JODConverter для вызова LibreOffice установки OpenOffice, Docx4j и XDocReport. Наилучшее форматирование было достигнуто с помощью LibreOffice. Однако даже в этом случае страницы были разными (например, 87-страничный RTF-файл приводит к 80-страничному PDF-файлу).

Итак, мы считаем, что идеальным способом преобразования было бы каким-то образом вызвать Microsoft Word через наше Java-приложение и выполнить преобразование с его помощью. Это приведет к созданию файлов PDF с тем же форматированием, что и у исходных файлов.

Возможно ли это любым из следующих способов:

  • API, который можно напрямую вызвать через Java?
  • API, который можно вызвать через .Чистый язык, и мы будем использовать это с чем-то вроде JACOB?
  • Сторонняя библиотека, которая использует установку Microsoft Word под капотом (что-то вроде JODConverter для Word)?
  • Интерфейс CLI, поддерживаемый Word (соответствующий вопрос)?
  • Что-то еще?

Комментарии:

1. Я этого не сделал, потому что Microsoft предлагает не использовать Word таким образом.