#python-3.x #azure #dataframe #pyspark #databricks
#python-3.x #azure #фрейм данных #pyspark #databricks
Вопрос:
Получение двух ошибок с моим скриптом запуска Databricks со следующей строкой:
df = spark.createDataFrame(pdDf).withColumn('month', substring(col('dt'), 0, 7))
Первый:
AttributeError: 'Series' object has no attribute 'substr'
и
NameError: name 'substr' is not defined
Интересно, что я делаю не так…
Ответ №1:
Оказалось, что я не импортировал pyspark.sql.functions
from pyspark.sql.functions import *