Как мне выполнить планирование емкости для HBase?

#hbase #capacity-planning

#hbase #планирование емкости

Вопрос:

Я планирую использовать HBase для социального приложения. Начальная пользовательская база будет составлять около 5 тыс., а ежемесячно она будет увеличиваться примерно на 3 тыс. в месяц.

Какой подход повысит эффективность моего приложения:

  1. Динамическое добавление ресурсов на ходу (я думаю, что чтение пострадает, если я попытаюсь загрузить данные через месяцы).
  2. Добавление статических ресурсов при запуске приложения (которое может обрабатывать все 25 ТБ данных с соответствующим региональным сервером и разделением регионов для равномерной записи данных и чтения будет быстрее).

PS: Средние данные, которые мое приложение будет обрабатывать в течение года, составят ~ 25 ТБ. Согласно планированию емкости HBase и определению размера региона, приложению потребуется 44 региональных сервера (без необходимости изменения конфигураций по умолчанию).

Есть предложения?