#elasticsearch #indexing #memory-management #storage
#elasticsearch #индексирование #управление памятью #Хранение
Вопрос:
Вопрос, есть ли способ рассчитать самое дорогое поле в индексе Elasticsearch.
ЦЕЛЬ состоит в том, чтобы рассчитать и сравнить размер хранилища и индекса двух полей в индексе elasticsearch.
Также разумно ли использовать поля двойного типа?
как строка в elasticsearch имеет text
поле, которое доступно для поиска, и .keyword
поле, которое можно агрегировать
Будет ли он использовать двойное пространство для хранения и индекса?
Ответ №1:
разумно ли использовать поля двойного типа. Например, строка в elasticsearch имеет текстовое поле с возможностью поиска и поле .keyword, которое можно агрегировать
Это полностью зависит от варианта использования. Поддерживайте как ключевое слово, так и текстовое представление значения поля, если: а) вам нужна возможность расширенного поиска по полю б) ваши текущие или будущие требования требуют возможности сортировки или агрегирования по полю.
В реальной жизни я видел для коротких текстовых полей, таких как ‘name’, ‘business-name’, ‘tag’ и т. Д., Имеет смысл поддерживать оба. Но для больших текстов, например, описания, я не думаю, что существуют варианты использования для агрегирования и сортировки (в целом).
Комментарии:
1. Имеет смысл, но требует ли это отдельной памяти. в случае 100 миллиардов документов это может быть важно, чтобы не было двойного ввода каждого поля emall
2. Если накладных расходов на память нет, то сотрудники es по умолчанию предоставили бы эту возможность, а не явно определяли ее. Пожалуйста, поддержите ответ, если это помогло