Ищу общий обзор по Hadoop

#hadoop #cloud #mapreduce #hdfs

#hadoop #облако #mapreduce #hdfs

Вопрос:

Я ищу некоторый обзор производительности Hadoop (кластер из 300-600 блоков, обычное оборудование), особенно по следующим аспектам:

  1. Высокая одновременность чтения и записи
  2. Сканирование веб-страниц
  3. Mapreduce, параллельные вычисления
  4. Инвертированный индекс

Ответ №1:

Это не конкретный вопрос, возможно, именно поэтому никто не ответил до сих пор. Производительность в кластере 3-600 узлов лучше всего анализировать с помощью тестов.

Тем не менее, я нашел несколько действительно интересных статей, касающихся Hadoop и его реализаций в производстве:

Я надеюсь, что эти ссылки помогут вам начать и предоставят всю необходимую информацию.