#apache-tika
#apache-tika
Вопрос:
Я хочу использовать сервер Tika для извлечения текста из PDF-файлов с помощью POST-запроса. Однако, когда размер PDF-файла слишком велик, появится ошибка 413 Entity too large. Как я могу увеличить размер?
Мой запрос выглядит так:
curl -F upload=@price.xls URL http://localhost:9998/tika/form
Комментарии:
1. Попробуйте один из URL-адресов Apache Tika, который принимает файл напрямую, не вмешиваясь в загрузку формы?
Ответ №1:
Вы всегда можете использовать pdfbox для разделения документа на страницы