Как выбрать различные и ненулевые значения из столбца фрейма данных в pyspark

#apache-spark #pyspark

Вопрос:

Как выбрать различные и ненулевые значения из столбца фрейма данных в py-spark.

Комментарии:

1. что ты пытался сделать?

Ответ №1:

Хорошо, я понял это…ниже приведена команда, в которой я выбираю все уникальные идентификаторы пользователей из столбца и исключаю пустые строки:

 df.select('UserID').distinct().where(col("userid").isNotNull())
 

И все же я верю, что может быть лучшая альтернатива.