#mysql #jdbc #apache-spark-sql #azure-databricks
Вопрос:
Я выполняю подключение JDBC к базе данных Mysql в Azure databricks env. Затем пытаюсь получить счетчик(идентификатор) с диапазоном дат 24 часа и фильтром по конкретной стране, но это занимает чертовски много времени. Как я могу улучшить производительность?
Запрос:
pushdown_query = """(select count(id) from Mysql_database where time > "{}" and time < "{}" and country IN ('FRA','AUT','DEU','CZE')) alias""".format(From_date,To_date)
df = spark.read.jdbc(url=jdbcUrl, table=pushdown_query, properties=connectionProperties)
display(df)
Ответ №1:
Действительно ли база данных Mysql_database большая? Если это так, вам может потребоваться добавить некоторые индексы в таблицу, если их там еще нет
Комментарии:
1. Спасибо вам за ваш ответ. Да, он большой. Я попробую добавить индексы.