Как определить размер таблицы HBase? Разные методы, разные результаты

#hdfs #hbase

Вопрос:

У меня в кластере есть таблица HBase. Я хочу определить размер этой таблицы HBase. Было 2 подхода, которым я следовал, и оба они дают совершенно разные размеры. Подходы таковы:

  1. Используя hdfs dfs -du -h команду в /apps/hbase/data/data/{db}/{table}
    Допустим, это дает размер 1 ТБ (без репликации).
  2. Использование главного пользовательского интерфейса HBase. Для той же таблицы под Table Stats , я мог видеть, что размер отображается как 202 ГБ. Приведенное описание таково Total size of store files .

Теперь, как я понимаю, файлы хранилища и файлы HF одинаковы, и размер таблицы должен быть одинаковым независимо от методов, перечисленных выше.

Не мог бы кто-нибудь, пожалуйста, объяснить мне, в каких ситуациях эти цифры могут так сильно отличаться?

Спасибо

Комментарии:

1. Что это hdfs dfs -du -x -h ... показывает?