Какие столбцы таблицы в mysql должны быть объявлены как поля сущности в документе solr?

#solr

#solr

Вопрос:

Я пытаюсь импортировать базу данных mysql в документ solr, используя xml, и в настоящее время просматриваю примеры, чтобы изучить и сделать это. Но я не могу понять, почему некоторые столбцы таблицы не объявлены как поля в сущности в data-config.xml .
Также мне нужно загрузить Oracle jdbc server, чтобы использовать dih для импорта базы данных mysql?

Ответ №1:

Единственные поля, которые должны попадать в Solr, — это те, по которым вы на самом деле планируете искать. Это может быть «большинство из них» или даже «все из них», но это может быть подмножество. Например, если ваша база данных содержит что-то вроде каталога продаж, у вас, скорее всего, будет products таблица в вашей базе данных MySQL, которая выглядит примерно так:

  ---------------- 
| products       |
 ---------------- 
| name           |
| brand          |
| description    |
| weight         |
| availability   |
| price          |
| shipping       |
| photo          |
| warehouse      |
 ---------------- 
  

Теперь люди не будут искать на вашем сайте тот товар, который они искали на складе 32B, или тот товар, который весит ровно 3,23 кг. Они ищут «газонокосилку koenig» или что-то еще.

В этом случае вы, вероятно, индексировали бы только первые три столбца (вероятно, как два поля, одно для имени и бренда и одно для описания).

Вот почему вы должны определить поля, которые вы хотите индексировать и как. Просто не существует разумного значения по умолчанию.

Что касается библиотеки, вам понадобится MySQL Connector / J jar отсюда.

Комментарии:

1. Не совсем верно. Возможно, вы захотите сохранить некоторые неиндексированные данные в SOLR. Для упрощения выборки, зачем делать вызов SOLR, а затем еще один вызов DB для извлечения всех других полей (которые могут охватывать более одной таблицы)

2. Конечно, вы всегда можете сохранить копии своих данных в Solr для удобства доступа — но не все хотят этого делать, поэтому Solr оставляет выбор за вами.

3. @WanderNauta: все сайты сообщают о регистрации dih в solrconfig.xml . Я работаю в Ubuntu, нужно ли мне удалять целые solrconfig.xml в папке примера, а затем добавьте DIH ИЛИ я должен просто добавить в файл с оставшимися образцами данных>

4. Вы должны добавить в файл.