#linear-regression #random-forest #categorical-data #dummy-variable #label-encoding
Вопрос:
У меня есть номинальные атрибуты в моем наборе данных, например, «Домен приложения«, поэтому я применил «Кодировку ярлыков» и уже закодировал, например, «Банковская система =1«, «Системы на заказ =2«.
Мой вопрос таков:
Если бы я назначил тип данных в качестве объекта для этих номинальных атрибутов.. Достаточно ли использовать непосредственно случайный лес на python.. или или сначала следует применить переменную чайников.
Поскольку я пытался использовать линейную регрессию, и она рассматривала их как числовую переменную, я ожидаю, что выдам мне ошибку, потому что их типы данных являются «объектами»