#python #pandas #linear-regression #pipeline #polynomials
Вопрос:
Я изучаю анализ данных с помощью Python, и есть кое-что, чего я не могу понять. Я понимаю, что существует три варианта разработки модели: Линейная, Линейная кратная и Полиномиальная. Однако затем я перехожу к новой концепции, называемой «трубопроводы». Я поместил здесь какой-то код:
Input=[('scale',StandardScaler()), ('polynomial', PolynomialFeatures(include_bias=False)), ('model',LinearRegression())]
Нормализация в порядке, однако я не понимаю, почему я ввожу в качестве параметра полиномиальную характеристику, если буду использовать линейную модель??? Для меня это не имеет смысла. Пожалуйста, не мог бы кто-нибудь разъяснить мне это?
Ответ №1:
Это распространенное заблуждение. Линейная модель относится к параметрам, а не к функциям. Скажите, что у вас есть особенности x
и ценности y
. Ваша линейная модель будет
y = a_0 a_1 * x
Вы можете создавать дополнительные функции с помощью арифметических операций, таких как, например x**2
. Теперь ваша модель становится
y = a_0 a_1 * x a_2 * x**2
Это все еще линейная модель, потому a_0
a_1
что и a_2
являются линейными. У него просто есть полиномиальная функция.
Комментарии:
1. Теперь это имеет смысл для меня!