#python #multiclass-classification #lightgbm #imbalanced-data
#python #мультиклассовая классификация #lightgbm #несбалансированные данные
Вопрос:
В официальном документе LightGBM говорится, что ‘scale_pos_weight’ можно использовать для управления весом меток с положительным классом.
https://lightgbm.readthedocs.io/en/latest/Parameters.html
Тем не менее, я пытаюсь решить многоклассовую классификацию. Цели кодируются как 0, 1 и 2.
Целевой 0 занимает 30% от общего количества выборок. И цель 2 занимает 10% от общего количества выборок. И цель 1 занимает 50% от общего количества выборок. Таким образом, классы несбалансированы.
Как я могу использовать scale_pos_weight для решения этой многоклассовой классификации?
Должен ли я кодировать цель, которая имеет относительно небольшой размер выборки, как положительную? После этого я должен кодировать цель, которая имеет относительно большой размер выборки, как отрицательный?
Ответ №1:
Для этого вы хотели бы использовать class_weight
параметр в соответствии с документами LGBMClassifier .