Экспорт таблицы Hbase в Hive

#hive #migration #hbase

#улей #миграция #hbase

Вопрос:

Привет 🙂 Я готовлюсь переместить все данные из 1 таблицы hbase в hive. Размер таблицы очень большой (500 терабайт)

В результате поиска есть hbase export, но поддерживается только перемещение данных между hbase и hbase (файлы, удаленные в hdfs, не являются обычным текстом, поэтому hive не может прочитать их немедленно) Кроме того, обработчик hbase в hive не может быть использован, поскольку hbase является удаленным кластером и имеет различные политики безопасности.

Было бы неплохо, если бы синтаксис INSERT INTO поддерживался как от улья к улью, но я ищу другой способ. Есть ли хороший способ разделить каждый столбец таблицы Hbase запятой и перенести его в hdfs?

Ответ №1:

Вы можете попробовать инструмент ExportSnapshot для перемещения данных из Hbase в HDFS в другом кластере, например,

 $ hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot MySnapshot -copy-to hdfs://yourserver:8020/hbase_root_dir -mappers 16
  

Проверьте это для получения более подробной информации.

Комментарии:

1. Спасибо за ответ! Но данные, перемещенные в другой кластер hdfs, записываются в формате Hbase (ImmutableBytesWritable), поэтому не могут быть прочитаны через hive