разделите все столбцы на каждый столбец в панд

#python #pandas

Вопрос:

У меня есть фрейм данных, подобный 1, и я пытаюсь создать новый фрейм данных 2, который состоит из соотношений каждого столбца вышеприведенного фрейма данных.

Исходный кадр данных

Предполагаемый выходной кадр данных

Я попробовал нижеприведенную логику.

 df_new = pd.concat([df[df.columns.difference([col])].div(df[col], axis=0)
                    .add_suffix('/R') for col in df.columns], axis=1)
 

Выход есть:

     B/R     C/R     D/R     A/R     C/R     D/R     A/R     B/R     D/R     A/R     B/R    C/R
0   0.46    1.16    0.78    2.16    2.50    1.69    0.86    0.40    0.68    1.28    0.59    1.48
1   1.05    1.25    1.64    0.95    1.19    1.55    0.80    0.84    1.30    0.61    0.64    0.77
2   1.56    2.78    2.78    0.64    1.79    1.79    0.36    0.56    1.00    0.36    0.56    1.00
3   0.54    2.23    0.35    1.86    4.14    0.64    0.45    0.24    0.16    2.89    1.56    6.44
 

Однако здесь я сталкиваюсь с двумя проблемами. Во-первых, я получаю как A/B, так и B/A, которые не нужны, а также увеличиваю количество столбцов. Есть ли способ получить вывод только A/B и исключить/ограничить B/A.

Вторая проблема связана с именованием столбцов с использованием метода добавления суффикса, который не передает, на что разделено. Есть ли способ создать имена столбцов, такие как A/B, для столбца A, разделенного на столбец B.

Ответ №1:

Используйте combinations с разделением столбцов в понимании списка:

 df = pd.DataFrame({
        'A':[5,3,6,9,2,4],
         'B':[4,5,4,5,5,4],
         'C':[7,8,9,4,2,3],
         'D':[1,3,5,7,1,8],
})

from  itertools import combinations

L = {f'{a}/{b}': df[a].div(df[b]) for a, b in combinations(df.columns, 2)}

df = pd.concat(L, axis=1)
print (df)
    A/B       A/C       A/D       B/C       B/D       C/D
0  1.25  0.714286  5.000000  0.571429  4.000000  7.000000
1  0.60  0.375000  1.000000  0.625000  1.666667  2.666667
2  1.50  0.666667  1.200000  0.444444  0.800000  1.800000
3  1.80  2.250000  1.285714  1.250000  0.714286  0.571429
4  0.40  1.000000  2.000000  2.500000  5.000000  2.000000
5  1.00  1.333333  0.500000  1.333333  0.500000  0.375000