цикл по словарю и применение преобразования фрейма данных

#pandas #dictionary

#pandas #словарь

Вопрос:

У меня есть фрейм данных. Я хочу сказать, что для всех столбцов, которые начинаются с ‘A’ или ‘C’, затем разделите все строки на среднее значение столбца.

Я не понимаю, почему мой код не работает.

    dict_trans={'A':'STA'
    ,'B':'SUB'
    ,'C':'STA'}




for k, v in dict_trans.items():
    if df_train.columns.str.startswith(k):
        transformation=v
        if transformation='STA':
            df['STA_' varname]=df[varname]/df.groupby(level=1)[varname].transform('mean')
  

Комментарии:

1. if transformation=’STA’, вероятно, должно быть if transformation==’STA’. В будущем было бы здорово, если бы вы также опубликовали сообщение об ошибке.

Ответ №1:

Пожалуйста, следуйте приведенному ниже коду. Я надеюсь, что вы пытаетесь выполнить операции над определенными столбцами, начинающимися с определенного совпадающего символа, и хотели создать из этого новую функцию.

    # Creating a sample data frame : 
df=pd.DataFrame({'A_1':range(10),
         'A_2':range(10,20),
          'B_2':range(21,31),
         'C_1':range(32,42)})


columns_required=list(filter(lambda x:(x.startswith('A') or x.startswith('C') ),(df.columns).tolist()))

dict_trans={'A_1':'STA'
    ,'A_2':'SUB'
    ,'B_2':'STA',
     'C_1':'STA'}

for index,value in dict_trans.items():
    if index in columns_required and value=='STA':
        df['STA_' index]=df.loc[:,index]/(df.loc[:,index]).mean()
  

Результат :

    A_1  A_2 B_2 C_1  STA_A_1        STA_C_1
0   0   10  21  32  0.000000    0.876712
1   1   11  22  33  0.222222    0.904110
2   2   12  23  34  0.444444    0.931507
3   3   13  24  35  0.666667    0.958904
4   4   14  25  36  0.888889    0.986301
5   5   15  26  37  1.111111    1.013699
6   6   16  27  38  1.333333    1.041096
7   7   17  28  39  1.555556    1.068493
8   8   18  29  40  1.777778    1.095890
9   9   19  30  41  2.000000    1.123288
  

Фрагмент кода