#hadoop #hive
#hadoop #улей
Вопрос:
Hadoop не предназначен для выполнения обновлений. Я попытался с hive
ним выполнить перезапись вставки, что является дорогостоящей операцией, также мы можем немного поработать с использованием Map reduce, что опять же является дорогостоящей операцией.
Есть ли у них какой-либо другой инструмент или способ, с помощью которого я могу это сделать frequent updates on Hadoop
или могу использовать spark
для того же. Пожалуйста, помогите мне, я не получаю достаточно информации об этом даже после 100-кратного поиска в Google. Заранее спасибо.
Ответ №1:
Если вам нужно обновлять Hadoop в режиме реального времени, Hbase — это решение, на которое вы, возможно, захотите взглянуть, Hive не предназначен для случайных / частых обновлений, это скорее инструмент для обработки данных, а не замена СУБД
Комментарии:
1. Спасибо новичку, но, к сожалению, я забыл упомянуть, что это транзакционные данные, для которых требуются объединения и другие дорогостоящие операции, которые не лучше всего подходят для NoSQL.