#dataframe #pyspark #apache-spark-sql
#фрейм данных #пыспарк #apache-spark-sql
Вопрос:
Я хочу равномерно распределить ряды по ведрам. Основываясь на следующих правилах:
Максимальное количество предметов в ведре: 5 Максимальная сумма (стоимость) в ведре: 35
Ввод:
-- ----- |id|value| -- ----- | 1| 1| | 2| 2| | 3| 4| | 4| 7| | 5| 9| | 6| 15| | 7| 19| | 8| 22| | 9| 32| -- -----
Ожидаемый результат:
-- ----- ------ |id|value|bucket| -- ----- ------ | 1| 1| 1| | 2| 2| 1| | 3| 4| 2| | 4| 7| 2| | 5| 9| 4| | 6| 15| 5| | 7| 19| 4| | 8| 22| 2| | 9| 32| 1| -- ----- ------