LightGBM: как я могу использовать scale_pos_weight в случае многоклассовой классификации?

#python #multiclass-classification #lightgbm #imbalanced-data

#python #мультиклассовая классификация #lightgbm #несбалансированные данные

Вопрос:

В официальном документе LightGBM говорится, что ‘scale_pos_weight’ можно использовать для управления весом меток с положительным классом.

https://lightgbm.readthedocs.io/en/latest/Parameters.html

Тем не менее, я пытаюсь решить многоклассовую классификацию. Цели кодируются как 0, 1 и 2.

Целевой 0 занимает 30% от общего количества выборок. И цель 2 занимает 10% от общего количества выборок. И цель 1 занимает 50% от общего количества выборок. Таким образом, классы несбалансированы.

Как я могу использовать scale_pos_weight для решения этой многоклассовой классификации?

Должен ли я кодировать цель, которая имеет относительно небольшой размер выборки, как положительную? После этого я должен кодировать цель, которая имеет относительно большой размер выборки, как отрицательный?

Ответ №1:

Для этого вы хотели бы использовать class_weight параметр в соответствии с документами LGBMClassifier .