#hdfs #hbase
Вопрос:
У меня в кластере есть таблица HBase. Я хочу определить размер этой таблицы HBase. Было 2 подхода, которым я следовал, и оба они дают совершенно разные размеры. Подходы таковы:
- Используя
hdfs dfs -du -h
команду в/apps/hbase/data/data/{db}/{table}
Допустим, это дает размер 1 ТБ (без репликации). - Использование главного пользовательского интерфейса HBase. Для той же таблицы под
Table Stats
, я мог видеть, что размер отображается как 202 ГБ. Приведенное описание таковоTotal size of store files
.
Теперь, как я понимаю, файлы хранилища и файлы HF одинаковы, и размер таблицы должен быть одинаковым независимо от методов, перечисленных выше.
Не мог бы кто-нибудь, пожалуйста, объяснить мне, в каких ситуациях эти цифры могут так сильно отличаться?
Спасибо
Комментарии:
1. Что это
hdfs dfs -du -x -h ...
показывает?