Заполнение недостающих строк «nan» с помощью pandas reindex

#python #pandas #reindex

#python #pandas #переиндексация

Вопрос:

Благодаря Джеффу я смог найти недостающие строки в своей файловой структуре данных и заполнить недостающие строки.

Однако заполненные недостающие строки в выводе показывают «2013-07-01 00:00:00,,,,,,,,,,,,,,,,,,», только не с нэн. Я хотел бы заполнить «NaN» или «nan» внутри запятых.

Мой код:

 filin = DataPath   'SKP_AWS_MIN_QC_10001_2013.07-09.DAT'
pd.set_option('max_rows',10)
data=pd.read_csv(filin,sep='#',index_col=[1],parse_dates=[1])
print data
index = pd.date_range('2013-07-01 00:00:00','2013-09-30 23:59:00',freq="T")
df = data
sk_f = df.reindex(index)
print sk_f
sk_f.to_csv("sample1.csv")
 

Насколько я знаю из информации о функции переиндексации, недостающие отверстия должны быть чем-то заполнены (по умолчанию «NaN»). Я не могу найти причину, по которой недостающее отверстие в моих файлах результатов не заполнено.

Любая идея или комментарий будут действительно оценены.

Спасибо, Исаак

Ответ №1:

Это не имеет ничего общего с тем reindex() , когда вы to_csv предоставляете строку для пропущенных значений, если вы не хотите, чтобы они отображались как пробелы. Что-то вроде df.to_csv('temp.csv',na_rep='NaN') сделает свое дело.

Если не указано, na_rep= по умолчанию используется значение ''

Комментарии:

1. @Isaac вы должны отметить этот ответ как правильный, проверьте meta.stackexchange.com/questions/5234 /…

2. @Andy Hayden Спасибо за комментарий, но я не могу найти способ проверить лучший или правильный ответ.

3. @Isaac Вы видели изображение здесь: meta.stackexchange.com/a/5235 (вы должны увидеть выделенную серым цветом галочку / галочку: щелкните по ней , чтобы она стала зеленой.)