lucene 3.0.3 | проблема с поиском в файле *.docx

#lucene.net #zend-search-lucene #lucene

#lucene.net #zend-поиск-lucene #lucene

Вопрос:

Я создаю индекс с помощью StandardAnalyzer для файла *.docx, все в порядке. Но во время поиска это не дает результата для этих файлов *.docx.

любая помощь или предложение будут оценены!!!

Комментарии:

1. Что именно вам нужно? Как проиндексировать тело файла .docx?

Ответ №1:

Как преобразовать файл *.docx в индексируемый (текстовый) формат?

Мы используем Apache POI, чтобы проиндексировать наш *.docx (и другие форматы office), и это работает довольно хорошо!

Вы можете взглянуть на реализацию здесь: http://code.google.com/p/gtxcontentconnector/source/browse/#svn/trunk/contentconnector-poi-transformer/src/main/java/com/gentics/cr/lucene/indexer/transformer