Вставка строк в фрейм данных Pandas, в котором отсутствуют строки на основе предыдущих значений строк

#pandas #rows #missing-data

#pandas #строки #отсутствует-данные

Вопрос:

Я новичок в Python, и это мой первый пост, поэтому я прошу прощения за любую двусмысленную формулировку.

У меня есть таблица со столбцом A, которая увеличивается от 1 до 5 за несколько итераций. Я хотел бы отсканировать столбец A и там, где этот шаблон не соответствует, вставить правильное число для A, скопировать столбец C и оставить недостающее значение для столбца B.

Было бы полезно просто вставить строку с пропущенными значениями в нужное место.

Пример

Ответ №1:

Вы можете reindex с помощью MultiIndex.from_product , а затем заполнить недостающие значения в столбце C с помощью ffill :

 df['G'] = (df.A.diff().fillna(-1) < 1).cumsum()
df.set_index(['G','A'], inplace=True)
print (df)
       B    C
G A          
1 1    1  Feb
  2    8  Feb
  4   64  Feb
  5  125  Feb
2 1    0  Feb
  3    6  Feb
  4   16  Feb
  5   31  Feb
3 1   -3  Feb
  3    4  Feb
  4   18  Feb
  5   29  Feb
 
 mux = pd.MultiIndex.from_product([df.index.get_level_values('G').unique(), 
                                  np.arange(1,6)], names=('G','A'))

df = df.reindex(mux)
df.C = df.C.ffill()

df = df.reset_index(level=0, drop=True).reset_index()
print (df)
    A      B    C
0   1    1.0  Feb
1   2    8.0  Feb
2   3    NaN  Feb
3   4   64.0  Feb
4   5  125.0  Feb
5   1    0.0  Feb
6   2    NaN  Feb
7   3    6.0  Feb
8   4   16.0  Feb
9   5   31.0  Feb
10  1   -3.0  Feb
11  2    NaN  Feb
12  3    4.0  Feb
13  4   18.0  Feb
14  5   29.0  Feb
 

Комментарии:

1. @Dickster — Спасибо 🙂