Могу ли я использовать Solr только для поиска по существующему индексу Lucene?

#solr #lucene

#solr #lucene

Вопрос:

Я использую Lucene локально для индексации документов. Я довольно хорошо знаю, как использовать Lucene. Я никогда не использовал Solr, но я хочу запустить веб-поиск с использованием индекса Lucene, поэтому я сейчас изучаю его.

Могу ли я установить Solr, скажем, на EC2, а затем вместо индексации документов с помощью Solr сделать это локально, используя Lucene напрямую, а затем просто перенести индекс Lucene с моего компьютера на EC2, который Solr будет использовать для поиска?

Я предполагаю, что это возможно, если я сохраняю индекс на диске, но хотел бы быть уверенным.

Спасибо!

Ответ №1:

Это, конечно, возможно, вам нужно только убедиться, что вы поддерживаете точно такую же структуру индекса (определенную схемой Solr). Однако это также будет означать, что ваша конфигурация будет храниться в двух совершенно разных местах — например, каждый раз, когда вы меняете анализатор в Lucene, вам нужно будет синхронизировать это изменение в конфигурации Solr XML. Я не уверен, какую пользу принесет Solr в таком случае использования.

Комментарии:

1. Спасибо за ваш ответ. Да, не думал об этом… Я планирую сканировать некоторые веб-сайты, а затем индексировать документы с помощью некоторых новых токенизаторов, которые я написал. Это может занять некоторое время, и я подумал, что было бы лучше сделать это локально, чем в облаке (где мне нужно заплатить за это).

2. Ничто не мешает вам выполнить индексацию в локальном экземпляре Solr, а затем скопировать индекс.

3. Понятно. Я использую анализатор, который я написал, может быть, вы знаете, где в Solr я должен включить файлы? Спасибо!