Трубопроводы в Pandas Python

#python #pandas #linear-regression #pipeline #polynomials

Вопрос:

Я изучаю анализ данных с помощью Python, и есть кое-что, чего я не могу понять. Я понимаю, что существует три варианта разработки модели: Линейная, Линейная кратная и Полиномиальная. Однако затем я перехожу к новой концепции, называемой «трубопроводы». Я поместил здесь какой-то код:

 Input=[('scale',StandardScaler()), ('polynomial', PolynomialFeatures(include_bias=False)), ('model',LinearRegression())]
 

Нормализация в порядке, однако я не понимаю, почему я ввожу в качестве параметра полиномиальную характеристику, если буду использовать линейную модель??? Для меня это не имеет смысла. Пожалуйста, не мог бы кто-нибудь разъяснить мне это?

Ответ №1:

Это распространенное заблуждение. Линейная модель относится к параметрам, а не к функциям. Скажите, что у вас есть особенности x и ценности y . Ваша линейная модель будет

 y = a_0   a_1 * x
 

Вы можете создавать дополнительные функции с помощью арифметических операций, таких как, например x**2 . Теперь ваша модель становится

 y = a_0   a_1 * x   a_2 * x**2
 

Это все еще линейная модель, потому a_0 a_1 что и a_2 являются линейными. У него просто есть полиномиальная функция.

Комментарии:

1. Теперь это имеет смысл для меня!