#azure #azure-databricks #azure-cloud-services #azure-machine-learning-service
#azure #azure-databricks #azure-облачные сервисы #azure-machine-learning-service
Вопрос:
Я использую Azure Databricks в качестве вычислительной цели из конвейера машинного обучения Azure с DatabricksStep для запуска скрипта Python, который доступен на вычислительном экземпляре, который работает как моя рабочая станция разработки (загружается в DBFS, а затем запускается в Databricks). Все работало нормально до вчерашнего утра (по итальянскому времени), но с тех пор только для запуска конвейера стали требоваться часы, и после запуска в некоторых случаях запуск завершается успешно, в то время как в других случаях он завершается ошибкой, приведенной ниже (из файла журналов выполнения Azure ML). Я также обновил версию Azure ML Python SDK с 1.14.0 до 1.15.0 без каких-либо улучшений.
[2020-10-05 12:55:30Z] Parsed interface. Will be submitting job to Azure Databricks adb-3647409015056007.7.azuredatabricks.net
[2020-10-05 12:55:36Z] Failed to submit job because of error: Unable to get module b436d4a1-3cc7-4382-a1ac-29bde5d24cb3: Microsoft.RelInfra.Common.Exceptions.OperationFailedException: Unable to download resource from , exception: Microsoft.RelInfra.Common.Exceptions.OperationFailedException: Cannot download resource. ---> Microsoft.RelInfra.Common.Exceptions.ServiceInvocationException: Failure in GetSnapshotFilesZipSas while calling service Snapshot; HttpMethod: GET; Response StatusCode: ; Exception type: System.Net.Http.HttpRequestException|-System.IO.IOException|-System.Net.Sockets.SocketException ---> System.Net.Http.HttpRequestException: The SSL connection could not be established, see inner exception. ---> System.IO.IOException: Unable to read data from the transport connection: Connection reset by peer. ---> System.Net.Sockets.SocketException: Connection reset by peer
Комментарии:
1. вы все еще видите эту ошибку? Для меня это похоже на сбой серверной службы….
2. все еще сегодня неприемлемое время для конвейера, чтобы выровнять start…no улучшения уже два дня