DATABRICKS connect 6.4 больше не может взаимодействовать с сервером

#pyspark #databricks #databricks-connect

#pyspark #databricks #databricks-connect

Вопрос:

Я запускаю Pycharm на своем MacBook.

Настройки клиента: интерпретатор Python -> Python 3.7 (dtabricks-connect-6.4)

Настройки кластера: Версия среды выполнения Databricks -> 6.4 (включает Apache Spark 2.4.5, Scala 2.11)

Он работал хорошо в течение нескольких месяцев, но внезапно, без каких-либо обновлений, я больше не могу запускать свой скрипт python из Pycharm для кластера databricks. Ошибка…

 Caused by: `java.lang.IllegalArgumentException: The cluster is running server version `dbr-6.4` but this client only supports Set(dbr-5.5)....`
  

Я перезапустил Pycharm, я вернулся и для интерпретатора перезапустил кластер и даже перезапустил свой MacBook, но это не помогло. Сообщение об ошибке просто ложное, потому что и кластер, и клиент используют ОДНУ и ТУ ЖЕ версию. Я вижу, что когда я выполняю свой скрипт на python, кластер запускается, но в конце происходит сбой.

 pyenv activate databricks-connect-6-4

pip freeze

Cython==0.29.21
databricks-connect==6.4.0
numpy==1.19.2
pandas==1.0.1
py4j==0.10.7
pyarrow==0.13.0
pycountry==20.7.3
python-dateutil==2.8.1
pytz==2020.1
six==1.15.0
  

введите описание изображения здесь

введите описание изображения здесь

Комментарии:

1. Я деинсталлировал и установил databricks-connect== 6.4, но это не помогло. Я попытался выполнить тест databricks-connect с тем же результатом. Мне кажется, что сам databricks внес некоторые изменения, не заметив нас

Ответ №1:

Похоже, что это было вызвано некоторыми внутренними изменениями на стороне сервера, и это не позволяет databricks-connect работать. Вы всегда можете отключить эту проверку, установив переменной среды DEBUG_IGNORE_VERSION_MISMATCH значение 1 ( export DEBUG_IGNORE_VERSION_MISMATCH=1 в консоли перед выполнением databricks-connect test ) — вы также можете установить эту переменную среды в PyCharm.

Обновление: это должно быть исправлено с помощью Databricks Connect 6.4.2, который был только что выпущен.

Ответ №2:

Спасибо, что подняли этот вопрос. Команда Databricks-Connect признала эту проблему, и мы работаем над исправлением для решения этой проблемы. Будет держать вас в курсе. Тем временем вы можете использовать DEBUG_IGNORE_VERSION_MISMATCH , как указал Алекс.

Обновление: для устранения этой проблемы выпущен совместимый клиент db-connect: версия 6.4.2 (https://pypi.org/project/databricks-connect/6.4.2 /, установить с помощью: pip install databricks-connect==6.4.2).