Созданные ElasticSearch документы не могут быть просмотрены в индексе

#java #elasticsearch #search #indexing #liferay

Вопрос:

я использую liferay 7.3.5 и пытаюсь создать эластичный поиск. Благодаря моему первому опыту в ElasticSearch я попытался проиндексировать одну из сущностей, которые у меня есть в базе данных. Я правильно построил поисковую платформу и работаю с ней в удаленном режиме в пределах определенного узла. Для индексирования я выполнил шаги один за другим в этом руководстве

Создание индексатора гостевой книги

Также это сделала обработка индексов на уровне сервиса, и она отлично работает, и в режиме отладки это хорошо видно, записи индексируются, преобразуются в документы и сохраняются в специальном номере индекса, который соответствует идентификатору компании в Liferay.

Я вижу этот индекс на локальном хосте в меню поиска.

Проблема в том, что при поиске в сгенерированном индексе с помощью Kibana или директа в elasticsearch я не нахожу свои собственные записи.

Вот моя конфигурация elasticsearch.

 # ======================== Elasticsearch Configuration =========================
#
# NOTE: Elasticsearch comes with reasonable defaults for most settings.
#       Before you set out to tweak and tune the configuration, make sure you
#       understand what are you trying to accomplish and the consequences.
#
# The primary way of configuring a node is via this file. This template lists
# the most important settings you may want to configure for a production cluster.
#
# Please consult the documentation for further information on configuration options:
# https://www.elastic.co/guide/en/elasticsearch/reference/index.html
#
# ---------------------------------- Cluster -----------------------------------
#
# Use a descriptive name for your cluster:
#
cluster.name: LiferayElasticsearchCluster
#
# ------------------------------------ Node ------------------------------------
#
# Use a descriptive name for the node:
#
node.name: node-1
#
# Add custom attributes to the node:
#
node.attr.rack: r1
#
# ----------------------------------- Paths ------------------------------------
#
# Path to directory where to store the data (separate multiple locations by comma):
#
#path.data: /path/to/data
#
# Path to log files:
#
#path.logs: /path/to/logs
#
# ----------------------------------- Memory -----------------------------------
#
# Lock the memory on startup:
#
#bootstrap.memory_lock: true
#
# Make sure that the heap size is set to about half the memory available
# on the system and that the owner of the process is allowed to use this
# limit.
#
# Elasticsearch performs poorly when the system is swapping the memory.
#
# ---------------------------------- Network -----------------------------------
#
# Set the bind address to a specific IP (IPv4 or IPv6):
#
network.host: 0.0.0.0
#
# Set a custom port for HTTP:
#
http.port: 9200
#
# For more information, consult the network module documentation.
#
# --------------------------------- Discovery ----------------------------------
#
# Pass an initial list of hosts to perform discovery when this node is started:
# The default list of hosts is ["127.0.0.1", "[::1]"]
#
discovery.seed_hosts: ["127.0.0.1", "[::1]"]
#
# Bootstrap the cluster using an initial set of master-eligible nodes:
#
#cluster.initial_master_nodes: ["node-1", "node-2"]
#
# For more information, consult the discovery and cluster formation module documentation.
#
# ---------------------------------- Gateway -----------------------------------
#
# Block initial recovery after a full cluster restart until N nodes are started:
#
#gateway.recover_after_nodes: 3
#
# For more information, consult the gateway module documentation.
#
# ---------------------------------- Various -----------------------------------
#
# Require explicit names when deleting indices:
#
#action.destructive_requires_name: true
 

некоторые запросы, такие как:

 curl -H 'Content-Type: application/json' -X GET https://localhost:9200/index_name?pretty
 

в индексе отображается только основное содержимое, и ни один из документов, созданных для индексируемой сущности, не отображается.

Вот основное содержание индекса

 {
  "took" : 51,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 10000,
      "relation" : "gte"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "liferay-37710",
        "_type" : "LiferayDocumentType",
        "_id" : "37710_spellCheckWord_hpItPms3XD6 xRXITXem4Q==",
        "_score" : 1.0,
        "_source" : {
          "uid" : "37710_spellCheckWord_hpItPms3XD6 xRXITXem4Q==",
          "companyId" : "37710",
          "spellCheckWord_es_ES" : "Roma",
          "groupId" : "0",
          "languageId" : "es_ES",
          "priority" : "0.0",
          "type" : "spellChecker"
        }
      },
      {
        "_index" : "liferay-37710",
        "_type" : "LiferayDocumentType",
        "_id" : "37710_spellCheckWord_4eLyz9eWq/ExLH2UIXzyjA==",
        "_score" : 1.0,
        "_source" : {
          "uid" : "37710_spellCheckWord_4eLyz9eWq/ExLH2UIXzyjA==",
          "companyId" : "37710",
          "spellCheckWord_es_ES" : "nabla",
          "groupId" : "0",
          "languageId" : "es_ES",
          "priority" : "0.0",
          "type" : "spellChecker"
        }
      },
      {
        "_index" : "liferay-37710",
        "_type" : "LiferayDocumentType",
        "_id" : "37710_spellCheckWord_9HJwraB61aNCiyw34D9pKQ==",
        "_score" : 1.0,
        "_source" : {
          "uid" : "37710_spellCheckWord_9HJwraB61aNCiyw34D9pKQ==",
          "companyId" : "37710",
          "spellCheckWord_es_ES" : "Sancho",
          "groupId" : "0",
          "languageId" : "es_ES",
          "priority" : "0.0",
          "type" : "spellChecker"
        }
      },
      {
        "_index" : "liferay-37710",
        "_type" : "LiferayDocumentType",
        "_id" : "37710_spellCheckWord_0M8pwRYwBq1tdRsWqXXSkQ==",
        "_score" : 1.0,
        "_source" : {
          "uid" : "37710_spellCheckWord_0M8pwRYwBq1tdRsWqXXSkQ==",
          "companyId" : "37710",
          "spellCheckWord_es_ES" : "neonat�logo",
          "groupId" : "0",
          "languageId" : "es_ES",
          "priority" : "0.0",
          "type" : "spellChecker"
        }
      },
      {
        "_index" : "liferay-37710",
        "_type" : "LiferayDocumentType",
        "_id" : "37710_spellCheckWord_urh2RmIpestSVBkqxfajlg==",
        "_score" : 1.0,
        "_source" : {
          "uid" : "37710_spellCheckWord_urh2RmIpestSVBkqxfajlg==",
          "companyId" : "37710",
          "spellCheckWord_es_ES" : "naturalizar",
          "groupId" : "0",
          "languageId" : "es_ES",
          "priority" : "0.0",
          "type" : "spellChecker"
        }
      },
      {
        "_index" : "liferay-37710",
        "_type" : "LiferayDocumentType",
        "_id" : "37710_spellCheckWord_WQdpBH7oN5SfNEhPdkwBCQ==",
        "_score" : 1.0,
        "_source" : {
          "uid" : "37710_spellCheckWord_WQdpBH7oN5SfNEhPdkwBCQ==",
          "companyId" : "37710",
          "spellCheckWord_es_ES" : "Montesa",
          "groupId" : "0",
          "languageId" : "es_ES",
          "priority" : "0.0",
          "type" : "spellChecker"
        }
      },
      {
        "_index" : "liferay-37710",
        "_type" : "LiferayDocumentType",
        "_id" : "37710_spellCheckWord_9Zk1wxijkzSFKbhDYUvLmg==",
        "_score" : 1.0,
        "_source" : {
          "uid" : "37710_spellCheckWord_9Zk1wxijkzSFKbhDYUvLmg==",
          "companyId" : "37710",
          "spellCheckWord_es_ES" : "natral",
          "groupId" : "0",
          "languageId" : "es_ES",
          "priority" : "0.0",
          "type" : "spellChecker"
        }
      },
      {
        "_index" : "liferay-37710",
        "_type" : "LiferayDocumentType",
        "_id" : "37710_spellCheckWord_/iyA0D3o33rpBLGqAKA iw==",
        "_score" : 1.0,
        "_source" : {
          "uid" : "37710_spellCheckWord_/iyA0D3o33rpBLGqAKA iw==",
          "companyId" : "37710",
          "spellCheckWord_es_ES" : "nerviosismo",
          "groupId" : "0",
          "languageId" : "es_ES",
          "priority" : "0.0",
          "type" : "spellChecker"
        }
      },
      {
        "_index" : "liferay-37710",
        "_type" : "LiferayDocumentType",
        "_id" : "37710_spellCheckWord_MQkMexFs2h9y6qh9lOPvAQ==",
        "_score" : 1.0,
        "_source" : {
          "uid" : "37710_spellCheckWord_MQkMexFs2h9y6qh9lOPvAQ==",
          "companyId" : "37710",
          "spellCheckWord_es_ES" : "nat�o",
          "groupId" : "0",
          "languageId" : "es_ES",
          "priority" : "0.0",
          "type" : "spellChecker"
        }
      },
      {
        "_index" : "liferay-37710",
        "_type" : "LiferayDocumentType",
        "_id" : "37710_spellCheckWord_1QP9Sy8zifQSnSiRfVcvKg==",
        "_score" : 1.0,
        "_source" : {
          "uid" : "37710_spellCheckWord_1QP9Sy8zifQSnSiRfVcvKg==",
          "companyId" : "37710",
          "spellCheckWord_es_ES" : "narcolepsia",
          "groupId" : "0",
          "languageId" : "es_ES",
          "priority" : "0.0",
          "type" : "spellChecker"
        }
      }
    ]
  }
}
 

Все еще чего-то не хватает, чтобы сделать?

Спасибо за помощь

Комментарии:

1. GET https://localhost:9200/index_name?pretty не вернет документы в индекс. Вам нужно выполнить запрос match_all или просто: GET https://localhost:9200/index_name/_search?pretty . Обратите _search внимание на ссылку в URL

2. Спасибо за ваш ответ, но это не помогает, потому что результаты не изменились

3. Что касается URL-адреса, который вставил Archit, он вернет только первые 10 элементов, вам следует добавить amp;size=1000 параметр, чтобы принудительно возвращать больше. Вы также можете попробовать выполнить фильтрацию по идентификатору группы с помощью q=groupId:<number> параметра. Так , например, если вы groupId = 202103 , запрос elasticsearch будет: http://localhost:9200/_search?q=groupId:202103amp;prettyamp;size=100

4. @jorgediaz-lr Это не сработало … Моя проблема заключалась в том, что ни один из созданных документов не был найден

Ответ №1:

Я смог решить проблему, очистив содержимое основного индекса и переиндексировав объект, и, таким образом, старые сопоставления были удалены, и конфликта больше не было. Поэтому документы были сохранены внутри индекса.