Разделение значений в столбце «является датой» или «NaT»

#python #pandas #dataframe #machine-learning #train-test-split

#python #панды #фрейм данных #машинное обучение #поезд-тест-разделение

Вопрос:

Я хотел бы найти значения в столбце ( clear_date ), которые не соответствуют действительной дате. Дата форматируется как '%Y/%m/%d' .

Я пробовал следующий фрагмент кода, но в результирующей переменной нет строк!

 x_test = dataset[dataset['clear_date'] == "NaT"].copy()
 

Вот картинка для справки:
введите описание изображения здесь

Комментарии:

1. что в dtype этом столбце?

2. @PierreD datetime64[ns]

Ответ №1:

Если clear_date столбец уже является правильным datetime, то:

 x_test = dataset.loc[dataset['clear_date'].isnull()].copy()
 

В противном случае, например, если это строка:

 x_test = dataset.loc[pd.to_date_time(dataset['clear_date']).isnull()].copy()
 

Комментарии:

1. clear_date Столбец уже является datetime Первый код сработал для меня. Спасибо 🙂