#python #pandas
#python #панды
Вопрос:
Я наткнулся на файл CSV, который содержит столбец даты, отформатированный следующим образом: xx:xx.x
, вот несколько данных, присутствующих в столбце, помеченном как дата:
07:33.0
34:53.0
06:30.0
30:09.0
02:18.0
Мой вопрос в том, что это за форматирование? И как я могу преобразовать его в правильный формат даты с помощью Python?
Комментарии:
1. Это не дата, это
minutes:seconds
Ответ №1:
Это выглядит как время без часов.
Вы можете создавать временные интервалы, добавляя 0
часы с помощью to_timedelta
:
df['col'] = pd.to_timedelta('00:' df['col'])
print (df)
col
0 0 days 00:07:33
1 0 days 00:34:53
2 0 days 00:06:30
3 0 days 00:30:09
4 0 days 00:02:18
Или преобразовать в datetimes по to_datetime
— добавляется значение по умолчанию date
:
df['col'] = pd.to_datetime(df['col'], format='%M:%S.%f')
print (df)
col
0 1900-01-01 00:07:33
1 1900-01-01 00:34:53
2 1900-01-01 00:06:30
3 1900-01-01 00:30:09
4 1900-01-01 00:02:18