#python #dataframe #prediction
#питон #фрейм данных #предсказание
Вопрос:
Если мой фрейм данных выглядит так:
user item property_1 property_2 property_3 rating u1 i1 90.2 0 NaN 0 u1 i2 80.2 1 0.90 1 u1 i3 70.2 1 NaN 1 u2 i2 80.2 1 0.90 0 u2 i4 80.4 0 0.10 1 u3 i1 90.2 0 NaN 1 u3 i4 80.4 0 0.10 1 u3 i5 93.9 1 0.33 0 u3 i6 90.9 0 0.55 0 u4 i1 90.2 0 NaN 0 u4 i6 90.9 0 0.55 1 u4 i7 50.2 1 NaN 1
И я хочу предсказать , что rating
user
даст item
использование этого properties
, какой метод я должен применить? Что-то, что будет смотреть на пары «пользователь-элемент».
Поскольку я использовал XGBoost для классификации в property_1
property_2
property_3
качестве функций, я получил хорошие результаты, но моя модель не знает , что больше пользователей оценили один и тот же элемент, не так ли? Что пользователи и элементы появляются несколько раз, даже если у меня нет дубликатов. Например, вторая строка и четвертая строка имеют одинаковые свойства, но разные оценки, потому что пользователи разные:
user item property_1 property_2 property_3 rating u1 i2 80.2 1 0.90 1 u2 i2 80.2 1 0.90 0
(У меня уже есть совместная фильтрация в отдельной модели, которая хорошо работает , но она не смотрит на properties
то item
, что я хочу использовать).