#web-services #pdf #text #ms-word
#веб-сервисы #PDF #текст #ms-word
Вопрос:
Я хочу написать (или использовать существующий) веб-сервис, который принимает файлы MS WORD и PDF, извлекает их содержимое и возвращает его в виде текста.
Кто-нибудь знает о таком сервисе или как его написать?
Ответ №1:
Для преобразования Word в текст вы можете использовать antiword
и передавать его выходные данные клиенту.
Для PDF есть PdfTk — его операция dump_data может быть полезной.
Комментарии:
1. Спасибо. Поскольку у меня есть веб-приложение, размещенное в Интернете, я не мог понять, как я вызываю эти программы из веб-приложения.
2. @Oded: Зависит от языка программирования, но у каждого есть способ вызывать внешние программы.