AttributeError: объект ‘DataFrame’ не имеет атрибута ‘raw_ratings’ при разделении фрейма данных

#python #scikit-learn

#python #scikit-learn

Вопрос:

Я сталкиваюсь с этой ошибкой при выполнении очень простого кода для разделения данных:

trainSet, testSet = train_test_split(datacf1, test_size=.25)

Мой фрейм данных имеет 3 столбца [‘ClientID’], [‘Products’], [‘Ratings’]

с типами данных соответственно float64, object, float64.

datacf1.head(5) Вывод:

     ClientId      Products    Ratings
0   103823.0      Product_A    5.631
1   501462.0      Product_B    -2.493
2   485961.0      Product_C    -1.154
3   945317.0      Product_D    1.541
4   140623.0      Product_E    3.215
 

Как я могу решить эту ошибку?

Комментарии:

1. пожалуйста, опубликуйте вывод datacf1.head (5)

2. ваш фрейм данных выглядит правильно, как и команда для его разделения. где-то в вашем коде вы пытаетесь получить доступ к некоторому объекту фрейма данных и его атрибуту ‘raw_ratings’. Пожалуйста, проверьте, есть ли у вас что-нибудь похожее на df.raw_ratings где-нибудь в вашем коде. Вот где ошибка.

3. Я не использовал ничего подобного df.raw_ratings в своем коде. Я просто создал datacf1 из моего исходного, высокомерного набора данных. Но я создал столбец [‘Ratings’], выполнив вычисление, может ли ошибка возникнуть оттуда?

4. вполне возможно. как выглядит вычисление? можете ли вы поделиться фрагментом кода?

5. @vincimojamdar это код, который я использую для создания столбца рейтинга: dfc[‘Rating’] = dfc.groupby(‘TradingAccountNumber’)[‘Quantity’].apply(лямбда x: x.astype (int) / x.astype(int).sum())