#sparkr
Вопрос:
Я пытаюсь создать общий столбец для каждой строки примерно для 100 столбцов. При каждом запуске имена этих столбцов немного меняются, поэтому мне нужно найти столбцы программно, а затем суммировать их.
Это то, что у меня сейчас есть:
features_max lt;- max(group_by(df, df$person_id) features_max lt;- fillna(features_max,0) colnames.features lt;- colnames(features_max) all.features lt;- colnames.features[grep('feature_id_', colnames.features)] all.features_with_plus lt;- paste(all.features, collapse = ' ') final_features lt;- withColumn(features_max, "tot_feats", sum(all.features_with_plus))
Я пробовал разные варианты последней строки, но безуспешно. Я либо получаю буквальное значение, либо ошибку. Любая помощь будет признательна!