Как работать с датой-временем или категорией в SimpleImputer?

#python #datetime #scikit-learn

Вопрос:

код выглядит так

 from sklearn.impute import SimpleImputer
from io import StringIO
csv_data = StringIO(""" 
    x1,x2,x3,x4,x5
    1,0.1,"1",2019-01-01,A
    2,,,2019-01-02,B
    3,,"3",2019-01-03,C
    ,0.4,"4",2019-01-04,A
    5,0.5,"5",2019-01-05,B
    ,,,2019-01-06,C
    7,0.7,"7",,A
    8,0.8,"8",2019-01-08,B
    9,0.9,,2019-01-09,C
    """)

df = pd.read_csv(csv_data, dtype={"x1": pd.Int64Dtype()}, parse_dates=[3])
imputer = SimpleImputer(strategy="most_frequent")
df = pd.DataFrame(imputer.fit_transform(df), columns=df.columns)


TypeError: cannot astype a datetimelike from [datetime64[ns]] to [float64]
 

Я пытался установить missing_values = None
, но это не сработало
, и еще одна ошибка также произошла с категориальными данными col x5 , а также после удаления col x4

Я предполагаю, что версия немного изменилась, но я не получаю подробностей

Что мне делать ?

Комментарии:

1. код отлично работает на моей машине как есть. Я запускаю sklearn.__версия__ -> 0.24.1