Pyspark, как преобразовать необработанные данные в формат SVMlight

#dataframe #pyspark #format #bigdata #rdd Вопрос: У меня есть один вопрос относительно карты Писпарка. Например, у меня есть следующие данные: data=[(1,1,1,10),(1,1,2,20),(2,1,3,15),(2,1,1,47),(3,0,2,28),(3,0,3,17)] df=spark.createDataFrame(data).toDF("ID","Target","features","value1") df.show() --- ------ -------- ------ | ID|Target|features|value1| ---…

Продолжить чтениеPyspark, как преобразовать необработанные данные в формат SVMlight

Как преобразовать необработанные данные(содержащие только 1 столбец), чтобы разделить каждую функцию на один столбец до указанного значения? Панды

#python #pandas #dataframe Вопрос: на рисунке показан только один столбец, все функции которого находятся в одном столбце, разделенном пустым пространством, но я хочу преобразовать каждое значение в отдельный столбец до…

Продолжить чтениеКак преобразовать необработанные данные(содержащие только 1 столбец), чтобы разделить каждую функцию на один столбец до указанного значения? Панды