Как сделать фильтр неравенства в pyspark

#python #pandas #pyspark

Вопрос:

Вот обычный код в pandas

 df= df[df.ColumnA  > df.ColumnB]
df=df[(df['ColumnA']<=6)amp;(df['ColumnA']>0)]

 

Что я пытаюсь

 df= df[df.select(ColumnA  > df.select(ColumnA)]
 

Сообщение об ошибке Py4JJavaError: An error occurred while calling o1395.select.

Ответ №1:

Не могли бы вы попробовать это? Мой писпарк немного заржавел, но я думаю, что он должен работать.

 df = df.filter(df.ColumnA > df.ColumnB)

df = df.filter((df.ColumnA > 0) amp; (df.ColumnA <= 6))