Как я могу интерпретировать коэффициенты после целевого кодирования с помощью мультикласса?

#encoding #target #categorical-data #multiclass-classification #dimensionality-reduction

Вопрос:

У меня есть набор данных с многоклассовой целью (который имеет три класса: 0, 1, 2). И, имея множество категориальных переменных, я сделал для них целевое кодирование. Но проблема заключалась в том, что обычный способ выполнения целевого кодирования — это когда у него есть двоичный вопрос. Итак, я закодировал свою метку (цель) одним горячим способом и применил целевую кодировку, как предложено here (https://towardsdatascience.com/target-encoding-for-multi-class-classification-c9a7bcb1a53 ).

Я знаю, что после однократного кодирования я могу удалить один из столбцов без какой-либо потери информации. Итак, наконец, я получил две функции для каждой отдельной категориальной переменной. Но после подгонки логистической регрессии с использованием pycaret я не могу интерпретировать важность функции, потому что каждая категориальная переменная разделена на две функции.

Например, X1_label1 имеет коэффициенты 1,9239, 1,2148, -3,1387 для трех меток, но X1_label2 имеет коэффициенты -0,5810, 0,2387, 0,3423.

Итак, мой вопрос в том, как я могу интерпретировать разделенные коэффициенты? Или есть какой-нибудь способ уменьшить размерность с двух (сейчас) до одного?(возможна сумма квадратов?) Мне действительно нужна ваша помощь.