#hive #mapreduce
#улей #mapreduce
Вопрос:
Я хочу знать разницу между hive и map reduce и есть ли какое-либо сравнение между ними. Показывает ли hive также некоторую часть map reduce
Ответ №1:
У Hive и MapReduce совершенно разные цели, они похожи на апельсины и яблоки.
MapReduce — это программный фреймворк для написания приложений, которые параллельно обрабатывают большие объемы данных в больших кластерах.
Hive — это база данных для обработки больших наборов данных, находящихся в распределенной файловой системе, с использованием SQL. Hive на Tez и Hive на MapReduce преобразуют SQL-запросы в серию заданий MapReduce (механизм выполнения Tez использует DAG).
MapReduce — это фреймворк общего назначения (набор библиотек и инструментов), вы можете использовать его для написания собственного приложения MapReduce на Java, Python, Scala, R.
А Hive — это база данных SQL, в ней есть функции reach SQL и хранилища данных, а также оптимизатор затрат для построения оптимального плана запросов.