Недостаточно данных при простом использовании столбцов функций?

#python #dataframe #prediction

#питон #фрейм данных #предсказание

Вопрос:

Если мой фрейм данных выглядит так:

 user item property_1 property_2 property_3 rating u1 i1 90.2 0 NaN 0 u1 i2 80.2 1 0.90 1 u1 i3 70.2 1 NaN 1 u2 i2 80.2 1 0.90 0 u2 i4 80.4 0 0.10 1 u3 i1 90.2 0 NaN 1 u3 i4 80.4 0 0.10 1 u3 i5 93.9 1 0.33 0 u3 i6 90.9 0 0.55 0 u4 i1 90.2 0 NaN 0 u4 i6 90.9 0 0.55 1 u4 i7 50.2 1 NaN 1  

И я хочу предсказать , что rating user даст item использование этого properties , какой метод я должен применить? Что-то, что будет смотреть на пары «пользователь-элемент».

Поскольку я использовал XGBoost для классификации в property_1 property_2 property_3 качестве функций, я получил хорошие результаты, но моя модель не знает , что больше пользователей оценили один и тот же элемент, не так ли? Что пользователи и элементы появляются несколько раз, даже если у меня нет дубликатов. Например, вторая строка и четвертая строка имеют одинаковые свойства, но разные оценки, потому что пользователи разные:

 user item property_1 property_2 property_3 rating u1 i2 80.2 1 0.90 1 u2 i2 80.2 1 0.90 0   

(У меня уже есть совместная фильтрация в отдельной модели, которая хорошо работает , но она не смотрит на properties то item , что я хочу использовать).