Выполнение операций обновления в Hadoop

#hadoop #hive

#hadoop #улей

Вопрос:

Hadoop не предназначен для выполнения обновлений. Я попытался с hive ним выполнить перезапись вставки, что является дорогостоящей операцией, также мы можем немного поработать с использованием Map reduce, что опять же является дорогостоящей операцией.

Есть ли у них какой-либо другой инструмент или способ, с помощью которого я могу это сделать frequent updates on Hadoop или могу использовать spark для того же. Пожалуйста, помогите мне, я не получаю достаточно информации об этом даже после 100-кратного поиска в Google. Заранее спасибо.

Ответ №1:

Если вам нужно обновлять Hadoop в режиме реального времени, Hbase — это решение, на которое вы, возможно, захотите взглянуть, Hive не предназначен для случайных / частых обновлений, это скорее инструмент для обработки данных, а не замена СУБД

Комментарии:

1. Спасибо новичку, но, к сожалению, я забыл упомянуть, что это транзакционные данные, для которых требуются объединения и другие дорогостоящие операции, которые не лучше всего подходят для NoSQL.