Azure Databricks и pyspark — ошибки подстроки

#python-3.x #azure #dataframe #pyspark #databricks

#python-3.x #azure #фрейм данных #pyspark #databricks

Вопрос:

Получение двух ошибок с моим скриптом запуска Databricks со следующей строкой:

 df = spark.createDataFrame(pdDf).withColumn('month', substring(col('dt'), 0, 7))
  

Первый:

 AttributeError: 'Series' object has no attribute 'substr'
  

и

 NameError: name 'substr' is not defined
  

Интересно, что я делаю не так…

Ответ №1:

Оказалось, что я не импортировал pyspark.sql.functions

 from pyspark.sql.functions import *