Проблема с производительностью при подключении jdbc-запроса select к Mysql в базах данных Azure

#mysql #jdbc #apache-spark-sql #azure-databricks

Вопрос:

Я выполняю подключение JDBC к базе данных Mysql в Azure databricks env. Затем пытаюсь получить счетчик(идентификатор) с диапазоном дат 24 часа и фильтром по конкретной стране, но это занимает чертовски много времени. Как я могу улучшить производительность?

Запрос:

 pushdown_query = """(select count(id) from Mysql_database where time > "{}" and time < "{}" and country IN ('FRA','AUT','DEU','CZE')) alias""".format(From_date,To_date)

df = spark.read.jdbc(url=jdbcUrl, table=pushdown_query, properties=connectionProperties)
display(df)

Ответ №1:

Действительно ли база данных Mysql_database большая? Если это так, вам может потребоваться добавить некоторые индексы в таблицу, если их там еще нет

Вопрос:

Ответ №1:

Комментарии:

Вам также может понравиться

Решение нелинейных уравнений с помощью «solve», неправильное решение

Не удается установить значение смещения для последнего элемента карусели?

Как ограничить папку мультимедиа с помощью Django ? Это какой-то способ?