Pyspark, как преобразовать необработанные данные в формат SVMlight
#dataframe #pyspark #format #bigdata #rdd Вопрос: У меня есть один вопрос относительно карты Писпарка. Например, у меня есть следующие данные: data=[(1,1,1,10),(1,1,2,20),(2,1,3,15),(2,1,1,47),(3,0,2,28),(3,0,3,17)] df=spark.createDataFrame(data).toDF("ID","Target","features","value1") df.show() --- ------ -------- ------ | ID|Target|features|value1| ---…