#python #pandas #reindex
#python #pandas #переиндексация
Вопрос:
Благодаря Джеффу я смог найти недостающие строки в своей файловой структуре данных и заполнить недостающие строки.
Однако заполненные недостающие строки в выводе показывают «2013-07-01 00:00:00,,,,,,,,,,,,,,,,,,», только не с нэн. Я хотел бы заполнить «NaN» или «nan» внутри запятых.
Мой код:
filin = DataPath 'SKP_AWS_MIN_QC_10001_2013.07-09.DAT'
pd.set_option('max_rows',10)
data=pd.read_csv(filin,sep='#',index_col=[1],parse_dates=[1])
print data
index = pd.date_range('2013-07-01 00:00:00','2013-09-30 23:59:00',freq="T")
df = data
sk_f = df.reindex(index)
print sk_f
sk_f.to_csv("sample1.csv")
Насколько я знаю из информации о функции переиндексации, недостающие отверстия должны быть чем-то заполнены (по умолчанию «NaN»). Я не могу найти причину, по которой недостающее отверстие в моих файлах результатов не заполнено.
Любая идея или комментарий будут действительно оценены.
Спасибо, Исаак
Ответ №1:
Это не имеет ничего общего с тем reindex()
, когда вы to_csv
предоставляете строку для пропущенных значений, если вы не хотите, чтобы они отображались как пробелы. Что-то вроде df.to_csv('temp.csv',na_rep='NaN')
сделает свое дело.
Если не указано, na_rep=
по умолчанию используется значение ''
Комментарии:
1. @Isaac вы должны отметить этот ответ как правильный, проверьте meta.stackexchange.com/questions/5234 /…
2. @Andy Hayden Спасибо за комментарий, но я не могу найти способ проверить лучший или правильный ответ.
3. @Isaac Вы видели изображение здесь: meta.stackexchange.com/a/5235 (вы должны увидеть выделенную серым цветом галочку / галочку: щелкните по ней , чтобы она стала зеленой.)