Питон озера Дельта

#apache-spark #pyspark #delta-lake

Вопрос:

Я настроил виртуальную среду внутри своего существующего кластера hadoop. Поскольку в текущем кластере нет spark >3 , я установил delta spark с помощью виртуальной среды. При попытке получить доступ к hdfs, который является kerberose, появляется ошибка ниже. Можете ли вы кто-нибудь помочь советом по этому поводу

Режим аутентификации клиента ПРОСТОЙ, механизм не поддерживается в зоне, Авторизация:kerberos_only

 from delta import *
    
builder = pyspark.sql.SparkSession.builder.appName("MyApp") 
   .config("spark.sql.extensions", "io.delta.sql.DeltaSparkSessionExtension") 
   .config("spark.sql.catalog.spark_catalog", "org.apache.spark.sql.delta.catalog.DeltaCatalog")
    
spark = configure_spark_with_delta_pip(builder).getOrCreate()
spark.read.parquet("hdfs/parquet_path")