#database #hive #hiveql
#База данных #hive #hiveql
Вопрос:
У меня есть эта таблица, которая обновляется каждый раз, когда выполняется инструкция «select *».
CREATE EXTERNAL TABLE TABLE_EXAMPLE (
id string
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY 'u0001'
LOCATION "/locationpath/files/";
Он считывает все файлы, которые находятся по этому пути, и добавляет их в таблицу.
Если вы запустите «select *», он считывает все новые файлы и помещает всю информацию в таблицу.
Идея в том, что я регулярно выполняю выбор и хочу проверить, есть ли новые файлы в каталоге.
Проблема: не обновляются свойства таблицы, в частности, «transient_lastDdlTime», дата последнего изменения, когда были добавлены новые данные.
Мне нужно, чтобы дата изменялась, когда в каталоге появляются новые файлы, и, следовательно, новые данные в таблице, когда я «выбираю *». (Чтобы я знал, была ли изменена таблица, для дальнейшей ее обработки)
Возможно ли это?
Приветствую Oli
Комментарии:
1. Как вы добавляете данные в эту таблицу? используя load, insert / select?
2. Вот в чем дело: выполняя «select * from TABLE_EXAMPLE», он добавляет все новые данные из новых файлов.