Какая база данных наиболее совместима со spark для визуализации данных?

#database #apache-spark

#База данных #apache-spark

Вопрос:

Я использую Twitter Steam и хотел сделать визуализацию для своих данных. Какая из рекомендуемых баз данных наиболее совместима и функционально обогащена?

Ответ №1:

Вы можете настроить конвейер данных, в котором вы извлекаете и перемещаете свои данные с помощью такого инструмента, как Apache Flume или / и Apache Kafka, анализируете их с помощью Spark и сохраняете в приемнике, таком как Elasticsearch (или любой другой NoSQL db). После этого вы можете запросить свои данные с помощью инструмента визуализации, такого как Kibana.

Комментарии:

1. можете ли вы порекомендовать какую-либо базу данных, которая была бы бесплатной и могла использоваться с JDBC connector онлайн?

2. Я бы рекомендовал использовать Apache Phoenix поверх Hbase. phoenix.apache.org