Разница между Mapreduce и hive

#hive #mapreduce

#улей #mapreduce

Вопрос:

Я хочу знать разницу между hive и map reduce и есть ли какое-либо сравнение между ними. Показывает ли hive также некоторую часть map reduce

Ответ №1:

У Hive и MapReduce совершенно разные цели, они похожи на апельсины и яблоки.

MapReduce — это программный фреймворк для написания приложений, которые параллельно обрабатывают большие объемы данных в больших кластерах.

Hive — это база данных для обработки больших наборов данных, находящихся в распределенной файловой системе, с использованием SQL. Hive на Tez и Hive на MapReduce преобразуют SQL-запросы в серию заданий MapReduce (механизм выполнения Tez использует DAG).

MapReduce — это фреймворк общего назначения (набор библиотек и инструментов), вы можете использовать его для написания собственного приложения MapReduce на Java, Python, Scala, R.

А Hive — это база данных SQL, в ней есть функции reach SQL и хранилища данных, а также оптимизатор затрат для построения оптимального плана запросов.