Разреженная матрица для наборов данных реального мира

#python #python-3.x #pytorch #sparse-matrix #recommender-systems

Вопрос:

Может ли кто-нибудь помочь мне понять процесс создания разреженных матриц для рекомендательных систем на Python для наборов данных реального мира. Все, что я вижу в Интернете, — это наборы данных с идентификатором клиента или идентификатором товара, начинающимся с 0, что недопустимо в наборах данных реального мира.

Комментарии:

1. Если единственная проблема заключается в том, что идентификатор клиента=0 и/или идентификатор товара=0, то у вас всегда может быть словарь для сопоставления идентификатора клиента «производство» с идентификатором клиента «машинное обучение». например: идентификатор пользователя «myusername1» => 0, «другой пользователь123» =>> 1 и т. Д…

2. Спасибо за комментарий. Я имел в виду то же самое решение, но как насчет новых идентификаторов клиентов или идентификаторов товаров, которые появятся в будущем ? Для этого я должен вести сортированный список и добавлять эти идентификаторы клиентов с их метками машинного обучения поэтапно ?

3. Новый идентификатор cust и идентификатор товара в будущем могут быть присвоены более высокому идентификатору «машинного обучения». Но для текущего обучения они все равно не понадобятся, поскольку выборочные данные для этих фьючерсов недоступны. Когда будет добавлен новый клиент и новый товар, вам нужно будет переобучить модель.