Веб-сервис WORD и преобразования PDF в текст

#web-services #pdf #text #ms-word

#веб-сервисы #PDF #текст #ms-word

Вопрос:

Я хочу написать (или использовать существующий) веб-сервис, который принимает файлы MS WORD и PDF, извлекает их содержимое и возвращает его в виде текста.

Кто-нибудь знает о таком сервисе или как его написать?

Ответ №1:

Для преобразования Word в текст вы можете использовать antiword и передавать его выходные данные клиенту.

Для PDF есть PdfTk — его операция dump_data может быть полезной.

Комментарии:

1. Спасибо. Поскольку у меня есть веб-приложение, размещенное в Интернете, я не мог понять, как я вызываю эти программы из веб-приложения.

2. @Oded: Зависит от языка программирования, но у каждого есть способ вызывать внешние программы.