#hadoop #metadata #impala
#hadoop #метаданные #impala
Вопрос:
Довольно новичок в экосистемных сервисах Hadoop, начинаю постепенно изучать материал.
Я пытался узнать об Apache Impala и его хранилище метаданных. В документации говорится, что специально для этого есть демон и как он собирается для каждой таблицы. Другие источники утверждают, что хранилище метаданных Hive на самом деле также является хранилищем метаданных Impala. Я не могу найти ни одного источника рекомендаций или какого-либо документа типа руководства пользователя для обработки метаданных в Impala, это потому, что хранилище метаданных на самом деле является хранилищем Hive?
Просто в целом смущает отсутствие информации.
Комментарии:
1. Метастор Hive и Impala одинаковы. Это внутренняя база данных impala / hive, хранящаяся в любой связанной базе данных. Зачем вам это знать? это внутреннее, поэтому оно скрыто снаружи. Не уверен, что вы можете получить к нему доступ.
2. @KoushikRoy хранилища метаданных начинают использоваться для управления данными, что является очень важной проблемой с тех пор, как начал действовать GDPR.