Плохая производительность в elasticsearch со многими текстовыми полями

#elasticsearch

#elasticsearch

Вопрос:

Моя среда:

Ubuntu 16.4, процессор 16 ядер, память 16 ГБ, SSD-диск.

200 текстовых полей.

У меня есть один узел.

Мы используем 4 потока с массовым API и частичными обновлениями.

Мы видим, что длительность GC составляет ~ 150 мс, это нормально?

Можем ли мы увеличить скорость индексации (текущая ~ 2000 с)? Потому что мы не видим никаких узких мест на процессоре и диске.

монитор kibana 1
монитор kibana 2

Комментарии:

1. Когда вы только индексируете и вам еще не нужно запрашивать данные, вы можете установить время обновления индекса равным -1, чтобы он не обновлял индекс во время индексации. Вам нужно будет установить желаемое время обновления индекса, как только индекс будет завершен. elastic.co/guide/en/elasticsearch/reference/current /…

Ответ №1:

прежде всего, длительность GC менее 200 мс является нормальной. для большей скорости индексации вы можете установить интервал обновления равным -1, а количество реплик равным 0. также вам следует протестировать объемный размер. попробуйте увеличить и уменьшить объемный размер и проверьте, изменилась ли скорость индексации. дополнительная информация: https://www.elastic.co/guide/en/elasticsearch/reference/master/tune-for-indexing-speed.html