как я могу рассчитать dfs, используемые в hadoop?

#hadoop #hdfs

#hadoop #hdfs

Вопрос:

У меня есть простой вопрос. dfs, используемый в моем пользовательском интерфейсе hadoop, составляет около 3 ТБ, но у меня есть данные объемом 1,4 ТБ в моем hdfs. используемый dfs — это использование данных * 3 из-за репликации 3? спасибо

Ответ №1:

Использование DFS в пользовательском интерфейсе Namenode = общее пространство, используемое в кластере для всех узлов данных.

Если коэффициент репликации равен 2, это будут «данные в одном datanode * 2»

Вы можете проверить общее и индивидуальное использование DFS в кластере, используя приведенную ниже команду —

hdfs dfsadmin -report