#python #pandas #pyspark
Вопрос:
Вот обычный код в pandas
df= df[df.ColumnA > df.ColumnB]
df=df[(df['ColumnA']<=6)amp;(df['ColumnA']>0)]
Что я пытаюсь
df= df[df.select(ColumnA > df.select(ColumnA)]
Сообщение об ошибке Py4JJavaError: An error occurred while calling o1395.select.
Ответ №1:
Не могли бы вы попробовать это? Мой писпарк немного заржавел, но я думаю, что он должен работать.
df = df.filter(df.ColumnA > df.ColumnB)
df = df.filter((df.ColumnA > 0) amp; (df.ColumnA <= 6))