при обновлении многих документов, как избежать проблемы с TOO_MANY_REQUESTS

#elasticsearch

#elasticsearch

Вопрос:

Существует большой индекс, недавно полностью обновленный этот индекс, чтобы добавить несколько новых полей

 health status index               uuid                   pri rep docs.count docs.deleted store.size pri.store.size
green  open   company             KTngnM6ASD-_KdU0FFAWRA   1   0   96008284      3662063     33.6gb         33.6gb
 

Первые 20 потоков одновременно для увеличения индекса, 200 записей на поток, использовалось 2 дня, но не удалось обновить 31712850 записей,

 id: 20078928430 opType: UPDATE status: TOO_MANY_REQUESTS
 

затем обновил только для этих сбойных записей, и на этот раз использовал 10 потоков, но на этот раз все еще существует та же проблема, 103800 записей обновлены с ошибкой, затем нужно снова обновить эти записи.

Итак, хотите знать, как избежать проблемы, когда обновление многих записей между тем занимает меньше времени?

Комментарии:

1. насколько велик ваш узел?

Ответ №1:

При интенсивной индексации вам может потребоваться оптимизировать скорость индексации и, возможно, сравнить с вашим кластером, чтобы определить оптимальный объемный размер и числа, зависящие от параллелизма, будут зависеть от конфигурации вашего кластера и сопоставления (некоторые функции, такие как n-граммы, имеют чрезвычайно большие накладные расходы при индексации). Также вы можете отслеживать использование пула потоков, чтобы обнаруживать проблемы на ранней стадии.