каков объем Cloudera CDH3 для 50 узлов

#hadoop #hbase #cloudera

#hadoop #hbase #cloudera

Вопрос:

Бесплатная версия поддерживает только ограниченные 50 узлов. Если я использую жесткий диск 10 раз 2T для одного компьютера. Это означает 10*2*50 = 1000T Я мог бы сохранить 1000T данных, верно?

Спасибо

Ответ №1:

Если вы не реплицируете свои данные, это правда.

Обычно в среде с 50 узлами ваша репликация установлена на 3 или 4. Что затем уменьшит объем хранимых вами уникальных данных до 1000T / 3 = 33T или до 1000T / 4 = 250T.

Комментарии:

1. Контрольные суммы CRC (4 байта на каждые 512 байт) занимают менее 1% пространства, что является основной нагрузкой. Затем есть ОС и другие, которые являются второстепенными.

2. Возможно, вы также захотите использовать часть своего диска для своей ОС и для системных журналов, поскольку вы не получите большой поддержки, если не будете вести хорошие журналы