#hadoop #hdfs
#hadoop #hdfs
Вопрос:
У меня есть простой вопрос. dfs, используемый в моем пользовательском интерфейсе hadoop, составляет около 3 ТБ, но у меня есть данные объемом 1,4 ТБ в моем hdfs. используемый dfs — это использование данных * 3 из-за репликации 3? спасибо
Ответ №1:
Использование DFS в пользовательском интерфейсе Namenode = общее пространство, используемое в кластере для всех узлов данных.
Если коэффициент репликации равен 2, это будут «данные в одном datanode * 2»
Вы можете проверить общее и индивидуальное использование DFS в кластере, используя приведенную ниже команду —
hdfs dfsadmin -report