Извлекать уникальные значения из поля в elasticsearch

#elasticsearch

#elasticsearch

Вопрос:

У меня есть такая структура документа :

 [
{
   "uuid":1,
   "data":{....},
   "date":"2020-10-10T23:00:00"
},
{
   "uuid":1,
   "data":{....},
   "date":"2020-10-10T23:00:00"
},
{
   "uuid":1,
   "data":{....},
   "date":"2020-10-10T23:00:00"
},
{
   "uuid":2,
   "data":{....},
   "date":"2020-10-10T23:00:00"
},
{
   "uuid":2,
   "data":{....},
   "date":"2020-10-10T23:00:00"
}
]
  

Как я могу написать запрос, который возвращает uuid. для приведенного выше примера я хочу этот результат:

 [1, 2]
  

Комментарии:

1. Документы вложены?

2. Нет, это не вложенный

Ответ №1:

Агрегирование на основе uuid поля:

Рабочий пример:

Сопоставления

 PUT my_index
{
  "mappings": {
    "properties": {
      "uuid": {
        "type": "keyword"
      },
      "date": {
        "type": "date"
      }
    }
  }
}
  

Вставить несколько документов:

 POST my_index/_doc/1
{
   "uuid":1,
   "date":"2020-10-10T23:00:00"
}
POST my_index/_doc/2
{
   "uuid":1,
   "date":"2020-10-10T23:00:00"
}
POST my_index/_doc/3
{
   "uuid":2,
   "date":"2020-10-10T23:00:00"
}
POST my_index/_doc/4
{
   "uuid":2,
   "date":"2020-10-10T23:00:00"
}
  

Поисковый запрос:

 GET my_index/_search
{
  "size": 0, 
  "aggs": {
    "uuids": {
      "terms": {
        "field": "uuid",
        "size": 10
      }
    }
  }
}
  

Результаты

 "aggregations" : {
    "uuids" : {
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
          "key" : "1",
          "doc_count" : 2
        },
        {
          "key" : "2",
          "doc_count" : 2
        }
      ]
    }
  }
  

key Поле внутри buckets — это uuid значение.