#database #apache-spark
#База данных #apache-spark
Вопрос:
Я использую Twitter Steam и хотел сделать визуализацию для своих данных. Какая из рекомендуемых баз данных наиболее совместима и функционально обогащена?
Ответ №1:
Вы можете настроить конвейер данных, в котором вы извлекаете и перемещаете свои данные с помощью такого инструмента, как Apache Flume или / и Apache Kafka, анализируете их с помощью Spark и сохраняете в приемнике, таком как Elasticsearch (или любой другой NoSQL db). После этого вы можете запросить свои данные с помощью инструмента визуализации, такого как Kibana.
Комментарии:
1. можете ли вы порекомендовать какую-либо базу данных, которая была бы бесплатной и могла использоваться с JDBC connector онлайн?
2. Я бы рекомендовал использовать Apache Phoenix поверх Hbase. phoenix.apache.org