#python #scikit-learn
#python #scikit-learn
Вопрос:
Я сталкиваюсь с этой ошибкой при выполнении очень простого кода для разделения данных:
trainSet, testSet = train_test_split(datacf1, test_size=.25)
Мой фрейм данных имеет 3 столбца [‘ClientID’], [‘Products’], [‘Ratings’]
с типами данных соответственно float64, object, float64.
datacf1.head(5)
Вывод:
ClientId Products Ratings
0 103823.0 Product_A 5.631
1 501462.0 Product_B -2.493
2 485961.0 Product_C -1.154
3 945317.0 Product_D 1.541
4 140623.0 Product_E 3.215
Как я могу решить эту ошибку?
Комментарии:
1. пожалуйста, опубликуйте вывод datacf1.head (5)
2. ваш фрейм данных выглядит правильно, как и команда для его разделения. где-то в вашем коде вы пытаетесь получить доступ к некоторому объекту фрейма данных и его атрибуту ‘raw_ratings’. Пожалуйста, проверьте, есть ли у вас что-нибудь похожее на df.raw_ratings где-нибудь в вашем коде. Вот где ошибка.
3. Я не использовал ничего подобного df.raw_ratings в своем коде. Я просто создал datacf1 из моего исходного, высокомерного набора данных. Но я создал столбец [‘Ratings’], выполнив вычисление, может ли ошибка возникнуть оттуда?
4. вполне возможно. как выглядит вычисление? можете ли вы поделиться фрагментом кода?
5. @vincimojamdar это код, который я использую для создания столбца рейтинга: dfc[‘Rating’] = dfc.groupby(‘TradingAccountNumber’)[‘Quantity’].apply(лямбда x: x.astype (int) / x.astype(int).sum())