Метаданные Apache Impala — удаляются из улья или это то же самое?

#hadoop #metadata #impala

#hadoop #метаданные #impala

Вопрос:

Довольно новичок в экосистемных сервисах Hadoop, начинаю постепенно изучать материал.

Я пытался узнать об Apache Impala и его хранилище метаданных. В документации говорится, что специально для этого есть демон и как он собирается для каждой таблицы. Другие источники утверждают, что хранилище метаданных Hive на самом деле также является хранилищем метаданных Impala. Я не могу найти ни одного источника рекомендаций или какого-либо документа типа руководства пользователя для обработки метаданных в Impala, это потому, что хранилище метаданных на самом деле является хранилищем Hive?

Просто в целом смущает отсутствие информации.

Комментарии:

1. Метастор Hive и Impala одинаковы. Это внутренняя база данных impala / hive, хранящаяся в любой связанной базе данных. Зачем вам это знать? это внутреннее, поэтому оно скрыто снаружи. Не уверен, что вы можете получить к нему доступ.

2. @KoushikRoy хранилища метаданных начинают использоваться для управления данными, что является очень важной проблемой с тех пор, как начал действовать GDPR.