#hadoop #hbase #cloudera
#hadoop #hbase #cloudera
Вопрос:
Бесплатная версия поддерживает только ограниченные 50 узлов. Если я использую жесткий диск 10 раз 2T для одного компьютера. Это означает 10*2*50 = 1000T Я мог бы сохранить 1000T данных, верно?
Спасибо
Ответ №1:
Если вы не реплицируете свои данные, это правда.
Обычно в среде с 50 узлами ваша репликация установлена на 3 или 4. Что затем уменьшит объем хранимых вами уникальных данных до 1000T / 3 = 33T или до 1000T / 4 = 250T.
Комментарии:
1. Контрольные суммы CRC (4 байта на каждые 512 байт) занимают менее 1% пространства, что является основной нагрузкой. Затем есть ОС и другие, которые являются второстепенными.
2. Возможно, вы также захотите использовать часть своего диска для своей ОС и для системных журналов, поскольку вы не получите большой поддержки, если не будете вести хорошие журналы