#java #elasticsearch #search #indexing #liferay
Вопрос:
я использую liferay 7.3.5 и пытаюсь создать эластичный поиск. Благодаря моему первому опыту в ElasticSearch я попытался проиндексировать одну из сущностей, которые у меня есть в базе данных. Я правильно построил поисковую платформу и работаю с ней в удаленном режиме в пределах определенного узла. Для индексирования я выполнил шаги один за другим в этом руководстве
Создание индексатора гостевой книги
Также это сделала обработка индексов на уровне сервиса, и она отлично работает, и в режиме отладки это хорошо видно, записи индексируются, преобразуются в документы и сохраняются в специальном номере индекса, который соответствует идентификатору компании в Liferay.
Я вижу этот индекс на локальном хосте в меню поиска.
Проблема в том, что при поиске в сгенерированном индексе с помощью Kibana или директа в elasticsearch я не нахожу свои собственные записи.
Вот моя конфигурация elasticsearch.
# ======================== Elasticsearch Configuration =========================
#
# NOTE: Elasticsearch comes with reasonable defaults for most settings.
# Before you set out to tweak and tune the configuration, make sure you
# understand what are you trying to accomplish and the consequences.
#
# The primary way of configuring a node is via this file. This template lists
# the most important settings you may want to configure for a production cluster.
#
# Please consult the documentation for further information on configuration options:
# https://www.elastic.co/guide/en/elasticsearch/reference/index.html
#
# ---------------------------------- Cluster -----------------------------------
#
# Use a descriptive name for your cluster:
#
cluster.name: LiferayElasticsearchCluster
#
# ------------------------------------ Node ------------------------------------
#
# Use a descriptive name for the node:
#
node.name: node-1
#
# Add custom attributes to the node:
#
node.attr.rack: r1
#
# ----------------------------------- Paths ------------------------------------
#
# Path to directory where to store the data (separate multiple locations by comma):
#
#path.data: /path/to/data
#
# Path to log files:
#
#path.logs: /path/to/logs
#
# ----------------------------------- Memory -----------------------------------
#
# Lock the memory on startup:
#
#bootstrap.memory_lock: true
#
# Make sure that the heap size is set to about half the memory available
# on the system and that the owner of the process is allowed to use this
# limit.
#
# Elasticsearch performs poorly when the system is swapping the memory.
#
# ---------------------------------- Network -----------------------------------
#
# Set the bind address to a specific IP (IPv4 or IPv6):
#
network.host: 0.0.0.0
#
# Set a custom port for HTTP:
#
http.port: 9200
#
# For more information, consult the network module documentation.
#
# --------------------------------- Discovery ----------------------------------
#
# Pass an initial list of hosts to perform discovery when this node is started:
# The default list of hosts is ["127.0.0.1", "[::1]"]
#
discovery.seed_hosts: ["127.0.0.1", "[::1]"]
#
# Bootstrap the cluster using an initial set of master-eligible nodes:
#
#cluster.initial_master_nodes: ["node-1", "node-2"]
#
# For more information, consult the discovery and cluster formation module documentation.
#
# ---------------------------------- Gateway -----------------------------------
#
# Block initial recovery after a full cluster restart until N nodes are started:
#
#gateway.recover_after_nodes: 3
#
# For more information, consult the gateway module documentation.
#
# ---------------------------------- Various -----------------------------------
#
# Require explicit names when deleting indices:
#
#action.destructive_requires_name: true
некоторые запросы, такие как:
curl -H 'Content-Type: application/json' -X GET https://localhost:9200/index_name?pretty
в индексе отображается только основное содержимое, и ни один из документов, созданных для индексируемой сущности, не отображается.
Вот основное содержание индекса
{
"took" : 51,
"timed_out" : false,
"_shards" : {
"total" : 1,
"successful" : 1,
"skipped" : 0,
"failed" : 0
},
"hits" : {
"total" : {
"value" : 10000,
"relation" : "gte"
},
"max_score" : 1.0,
"hits" : [
{
"_index" : "liferay-37710",
"_type" : "LiferayDocumentType",
"_id" : "37710_spellCheckWord_hpItPms3XD6 xRXITXem4Q==",
"_score" : 1.0,
"_source" : {
"uid" : "37710_spellCheckWord_hpItPms3XD6 xRXITXem4Q==",
"companyId" : "37710",
"spellCheckWord_es_ES" : "Roma",
"groupId" : "0",
"languageId" : "es_ES",
"priority" : "0.0",
"type" : "spellChecker"
}
},
{
"_index" : "liferay-37710",
"_type" : "LiferayDocumentType",
"_id" : "37710_spellCheckWord_4eLyz9eWq/ExLH2UIXzyjA==",
"_score" : 1.0,
"_source" : {
"uid" : "37710_spellCheckWord_4eLyz9eWq/ExLH2UIXzyjA==",
"companyId" : "37710",
"spellCheckWord_es_ES" : "nabla",
"groupId" : "0",
"languageId" : "es_ES",
"priority" : "0.0",
"type" : "spellChecker"
}
},
{
"_index" : "liferay-37710",
"_type" : "LiferayDocumentType",
"_id" : "37710_spellCheckWord_9HJwraB61aNCiyw34D9pKQ==",
"_score" : 1.0,
"_source" : {
"uid" : "37710_spellCheckWord_9HJwraB61aNCiyw34D9pKQ==",
"companyId" : "37710",
"spellCheckWord_es_ES" : "Sancho",
"groupId" : "0",
"languageId" : "es_ES",
"priority" : "0.0",
"type" : "spellChecker"
}
},
{
"_index" : "liferay-37710",
"_type" : "LiferayDocumentType",
"_id" : "37710_spellCheckWord_0M8pwRYwBq1tdRsWqXXSkQ==",
"_score" : 1.0,
"_source" : {
"uid" : "37710_spellCheckWord_0M8pwRYwBq1tdRsWqXXSkQ==",
"companyId" : "37710",
"spellCheckWord_es_ES" : "neonat�logo",
"groupId" : "0",
"languageId" : "es_ES",
"priority" : "0.0",
"type" : "spellChecker"
}
},
{
"_index" : "liferay-37710",
"_type" : "LiferayDocumentType",
"_id" : "37710_spellCheckWord_urh2RmIpestSVBkqxfajlg==",
"_score" : 1.0,
"_source" : {
"uid" : "37710_spellCheckWord_urh2RmIpestSVBkqxfajlg==",
"companyId" : "37710",
"spellCheckWord_es_ES" : "naturalizar",
"groupId" : "0",
"languageId" : "es_ES",
"priority" : "0.0",
"type" : "spellChecker"
}
},
{
"_index" : "liferay-37710",
"_type" : "LiferayDocumentType",
"_id" : "37710_spellCheckWord_WQdpBH7oN5SfNEhPdkwBCQ==",
"_score" : 1.0,
"_source" : {
"uid" : "37710_spellCheckWord_WQdpBH7oN5SfNEhPdkwBCQ==",
"companyId" : "37710",
"spellCheckWord_es_ES" : "Montesa",
"groupId" : "0",
"languageId" : "es_ES",
"priority" : "0.0",
"type" : "spellChecker"
}
},
{
"_index" : "liferay-37710",
"_type" : "LiferayDocumentType",
"_id" : "37710_spellCheckWord_9Zk1wxijkzSFKbhDYUvLmg==",
"_score" : 1.0,
"_source" : {
"uid" : "37710_spellCheckWord_9Zk1wxijkzSFKbhDYUvLmg==",
"companyId" : "37710",
"spellCheckWord_es_ES" : "natral",
"groupId" : "0",
"languageId" : "es_ES",
"priority" : "0.0",
"type" : "spellChecker"
}
},
{
"_index" : "liferay-37710",
"_type" : "LiferayDocumentType",
"_id" : "37710_spellCheckWord_/iyA0D3o33rpBLGqAKA iw==",
"_score" : 1.0,
"_source" : {
"uid" : "37710_spellCheckWord_/iyA0D3o33rpBLGqAKA iw==",
"companyId" : "37710",
"spellCheckWord_es_ES" : "nerviosismo",
"groupId" : "0",
"languageId" : "es_ES",
"priority" : "0.0",
"type" : "spellChecker"
}
},
{
"_index" : "liferay-37710",
"_type" : "LiferayDocumentType",
"_id" : "37710_spellCheckWord_MQkMexFs2h9y6qh9lOPvAQ==",
"_score" : 1.0,
"_source" : {
"uid" : "37710_spellCheckWord_MQkMexFs2h9y6qh9lOPvAQ==",
"companyId" : "37710",
"spellCheckWord_es_ES" : "nat�o",
"groupId" : "0",
"languageId" : "es_ES",
"priority" : "0.0",
"type" : "spellChecker"
}
},
{
"_index" : "liferay-37710",
"_type" : "LiferayDocumentType",
"_id" : "37710_spellCheckWord_1QP9Sy8zifQSnSiRfVcvKg==",
"_score" : 1.0,
"_source" : {
"uid" : "37710_spellCheckWord_1QP9Sy8zifQSnSiRfVcvKg==",
"companyId" : "37710",
"spellCheckWord_es_ES" : "narcolepsia",
"groupId" : "0",
"languageId" : "es_ES",
"priority" : "0.0",
"type" : "spellChecker"
}
}
]
}
}
Все еще чего-то не хватает, чтобы сделать?
Спасибо за помощь
Комментарии:
1.
GET https://localhost:9200/index_name?pretty
не вернет документы в индекс. Вам нужно выполнить запрос match_all или просто:GET https://localhost:9200/index_name/_search?pretty
. Обратите_search
внимание на ссылку в URL2. Спасибо за ваш ответ, но это не помогает, потому что результаты не изменились
3. Что касается URL-адреса, который вставил Archit, он вернет только первые 10 элементов, вам следует добавить
amp;size=1000
параметр, чтобы принудительно возвращать больше. Вы также можете попробовать выполнить фильтрацию по идентификатору группы с помощьюq=groupId:<number>
параметра. Так , например, если выgroupId = 202103
, запрос elasticsearch будет:http://localhost:9200/_search?q=groupId:202103amp;prettyamp;size=100
4. @jorgediaz-lr Это не сработало … Моя проблема заключалась в том, что ни один из созданных документов не был найден
Ответ №1:
Я смог решить проблему, очистив содержимое основного индекса и переиндексировав объект, и, таким образом, старые сопоставления были удалены, и конфликта больше не было. Поэтому документы были сохранены внутри индекса.