#lucene.net #zend-search-lucene #lucene
#lucene.net #zend-поиск-lucene #lucene
Вопрос:
Я создаю индекс с помощью StandardAnalyzer для файла *.docx, все в порядке. Но во время поиска это не дает результата для этих файлов *.docx.
любая помощь или предложение будут оценены!!!
Комментарии:
1. Что именно вам нужно? Как проиндексировать тело файла .docx?
Ответ №1:
Как преобразовать файл *.docx в индексируемый (текстовый) формат?
Мы используем Apache POI, чтобы проиндексировать наш *.docx (и другие форматы office), и это работает довольно хорошо!
Вы можете взглянуть на реализацию здесь: http://code.google.com/p/gtxcontentconnector/source/browse/#svn/trunk/contentconnector-poi-transformer/src/main/java/com/gentics/cr/lucene/indexer/transformer