Проблема с производительностью при подключении jdbc-запроса select к Mysql в базах данных Azure

#mysql #jdbc #apache-spark-sql #azure-databricks

Вопрос:

Я выполняю подключение JDBC к базе данных Mysql в Azure databricks env. Затем пытаюсь получить счетчик(идентификатор) с диапазоном дат 24 часа и фильтром по конкретной стране, но это занимает чертовски много времени. Как я могу улучшить производительность?

Запрос:

 pushdown_query = """(select count(id) from Mysql_database where time > "{}" and time < "{}" and country IN ('FRA','AUT','DEU','CZE')) alias""".format(From_date,To_date)

df = spark.read.jdbc(url=jdbcUrl, table=pushdown_query, properties=connectionProperties)
display(df)
 

Ответ №1:

Действительно ли база данных Mysql_database большая? Если это так, вам может потребоваться добавить некоторые индексы в таблицу, если их там еще нет

Комментарии:

1. Спасибо вам за ваш ответ. Да, он большой. Я попробую добавить индексы.