#java
#java
Вопрос:
Я столкнулся с проблемой поиска какого-либо решения для преобразования моего PDF в HTMl / xml. Это требование возникает из-за того, что у меня есть сертификат в виде PDF-формы.Мне нужно сделать этот сертификат доступным для пользователя в виде HTML-страницы (в частности, с использованием JSF). Пользователь может редактировать эту форму и обновлять значения.Эти значения будут считаны backing bean, чтобы я мог быть сохранен в базе данных.Проблема в том, что эти сертификаты продолжали меняться примерно через 3 месяца. Итак, если я использую тривиальный подход к написанию всех компонентов в HTML, мне будет чертовски сложно поддерживать и изменять. Итак, я хочу, чтобы, если есть какая-либо утилита JAVA, которую я могу настроить так, чтобы я мог отображать страницу с использованием XML.
С нетерпением жду ответа. заранее спасибо!!!
Ответ №1:
Вы могли бы попробовать вот это: pdftohtml. Он выглядит довольно старым, последняя версия выпущена в 2006 году.
Если вам нужен только необработанный текст: рассмотрите возможность использования itext, проанализируйте необработанный текст и заполните его в XML-документе.
Комментарии:
1. привет, Андреас .. спасибо, что указали эти доступные программы. не могли бы вы, пожалуйста, немного рассказать о том, как я могу использовать PDFBox для того же.