нарисуйте квантильные линии и соедините два графика скрипки

#python #plotly

#python #plotly

Вопрос:

Как мне нарисовать квантильные линии и соединить два графика скрипки в plotly на Python?

Например, для этого есть библиотека в R (https://github.com/GRousselet/rogme ). Предоставленная библиотека не обязательно работает при наличии более двух групп.

введите описание изображения здесь

Ответ №1:

Определенно нет встроенного метода, чтобы сделать что-то подобное в Plotly. Лучшее, что вы можете сделать, это, вероятно, нарисовать несколько линий и рассмотреть возможность написания функции или нескольких циклов, если вам нужно сделать это для нескольких групп данных для разных значений квантилей.

Вот как я бы начал. Вы можете создать список или массив для хранения всех координат линий, если хотите соединить одинаковые квантили из сгруппированных графиков скрипки. Я признаю, что то, что у меня есть на данный момент, является хакерским, поскольку оно основано на группах на графике, имеющих координаты y, начинающиеся с 0 и увеличивающиеся на 1. Возможно, есть способ получить доступ к y-координатам сгруппированных графиков скрипки, я бы рекомендовал заглянуть в документацию.

Потребуется проделать еще некоторую работу, если вы хотите добавить текстовые поля для указания значений квантилей.

 import numpy as np
import pandas as pd

import plotly.express as px
import plotly.graph_objects as go

# generate some random data that is normally distributed
np.random.seed(42)
y1 = np.random.normal(0, 1, 1000) * 1.5   6
y2 = np.random.normal(0, 5, 1000)   6

# group the data together and combine into one dataframe
df1 = pd.DataFrame({'Group': 'Group1', 'Values': y1})
df2 = pd.DataFrame({'Group': 'Group2', 'Values': y2})
df_final = pd.concat([df1, df2])

fig = px.strip(df_final, x='Values', y='Group', color_discrete_sequence=['grey'])

quantiles_list = [0.05, 0.10, 0.25, 0.50, 0.75, 0.90, 0.95]

## this is a bit hacky and relies on y coordinates for groups starting from 0 and increasing by 1
y_diff = 0
## these store the coordinates in order to connect the quantile lines
lower_coordinates, upper_coordinates = [], []
for group_name in df_final.Group.unique():
    for quantile in quantiles_list:
        quantile_value = np.quantile(df_final[df_final['Group'] == group_name].Values, quantile)
        if group_name == 'Group1':
            lower_coordinates.append((quantile_value, 0.2 1*y_diff))
        if group_name == 'Group2':
            upper_coordinates.append((quantile_value, -0.2 1*y_diff))
        fig.add_shape(
                # Vertical Line for Group1
                dict(
                    type="line",
                    x0=quantile_value,
                    y0=-0.2 1*y_diff,
                    x1=quantile_value,
                    y1=0.2 1*y_diff,
                    line=dict(
                        color="black",
                        width=4
                    )
                ),
        )
    y_diff  = 1

## draw connecting lines
for idx in range(len(upper_coordinates)):
    fig.add_shape(
            dict(
                type="line",
                x0=lower_coordinates[idx][0],
                y0=lower_coordinates[idx][1],
                x1=upper_coordinates[idx][0],
                y1=upper_coordinates[idx][1],
                line=dict(
                    color="chocolate",
                    width=4
                    )
                ),
    )
fig.show()
  

введите описание изображения здесь