#solr #lucene
#solr #lucene
Вопрос:
Я использую Lucene локально для индексации документов. Я довольно хорошо знаю, как использовать Lucene. Я никогда не использовал Solr, но я хочу запустить веб-поиск с использованием индекса Lucene, поэтому я сейчас изучаю его.
Могу ли я установить Solr, скажем, на EC2, а затем вместо индексации документов с помощью Solr сделать это локально, используя Lucene напрямую, а затем просто перенести индекс Lucene с моего компьютера на EC2, который Solr будет использовать для поиска?
Я предполагаю, что это возможно, если я сохраняю индекс на диске, но хотел бы быть уверенным.
Спасибо!
Ответ №1:
Это, конечно, возможно, вам нужно только убедиться, что вы поддерживаете точно такую же структуру индекса (определенную схемой Solr). Однако это также будет означать, что ваша конфигурация будет храниться в двух совершенно разных местах — например, каждый раз, когда вы меняете анализатор в Lucene, вам нужно будет синхронизировать это изменение в конфигурации Solr XML. Я не уверен, какую пользу принесет Solr в таком случае использования.
Комментарии:
1. Спасибо за ваш ответ. Да, не думал об этом… Я планирую сканировать некоторые веб-сайты, а затем индексировать документы с помощью некоторых новых токенизаторов, которые я написал. Это может занять некоторое время, и я подумал, что было бы лучше сделать это локально, чем в облаке (где мне нужно заплатить за это).
2. Ничто не мешает вам выполнить индексацию в локальном экземпляре Solr, а затем скопировать индекс.
3. Понятно. Я использую анализатор, который я написал, может быть, вы знаете, где в Solr я должен включить файлы? Спасибо!