GroupBy с ApplyInPandas в PySpark — как правильно реализовать UDF?
#apache-spark #pyspark #apache-spark-sql #apache-spark #pyspark #apache-spark-sql Вопрос: Я пытаюсь использовать PandasUDF в PySpark, чтобы найти "самый длинный уникальный хвост" в иерархии. Например, если мой ввод является: 1.2 1.2.3 тогда самый…