#python #datetime #scikit-learn
Вопрос:
код выглядит так
from sklearn.impute import SimpleImputer
from io import StringIO
csv_data = StringIO("""
x1,x2,x3,x4,x5
1,0.1,"1",2019-01-01,A
2,,,2019-01-02,B
3,,"3",2019-01-03,C
,0.4,"4",2019-01-04,A
5,0.5,"5",2019-01-05,B
,,,2019-01-06,C
7,0.7,"7",,A
8,0.8,"8",2019-01-08,B
9,0.9,,2019-01-09,C
""")
df = pd.read_csv(csv_data, dtype={"x1": pd.Int64Dtype()}, parse_dates=[3])
imputer = SimpleImputer(strategy="most_frequent")
df = pd.DataFrame(imputer.fit_transform(df), columns=df.columns)
TypeError: cannot astype a datetimelike from [datetime64[ns]] to [float64]
Я пытался установить missing_values = None
, но это не сработало
, и еще одна ошибка также произошла с категориальными данными col x5
, а также после удаления col x4
Я предполагаю, что версия немного изменилась, но я не получаю подробностей
Что мне делать ?
Комментарии:
1. код отлично работает на моей машине как есть. Я запускаю sklearn.__версия__ ->
0.24.1