#python #plotly
#python #plotly
Вопрос:
Как мне нарисовать квантильные линии и соединить два графика скрипки в plotly на Python?
Например, для этого есть библиотека в R (https://github.com/GRousselet/rogme ). Предоставленная библиотека не обязательно работает при наличии более двух групп.
Ответ №1:
Определенно нет встроенного метода, чтобы сделать что-то подобное в Plotly. Лучшее, что вы можете сделать, это, вероятно, нарисовать несколько линий и рассмотреть возможность написания функции или нескольких циклов, если вам нужно сделать это для нескольких групп данных для разных значений квантилей.
Вот как я бы начал. Вы можете создать список или массив для хранения всех координат линий, если хотите соединить одинаковые квантили из сгруппированных графиков скрипки. Я признаю, что то, что у меня есть на данный момент, является хакерским, поскольку оно основано на группах на графике, имеющих координаты y, начинающиеся с 0 и увеличивающиеся на 1. Возможно, есть способ получить доступ к y-координатам сгруппированных графиков скрипки, я бы рекомендовал заглянуть в документацию.
Потребуется проделать еще некоторую работу, если вы хотите добавить текстовые поля для указания значений квантилей.
import numpy as np
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
# generate some random data that is normally distributed
np.random.seed(42)
y1 = np.random.normal(0, 1, 1000) * 1.5 6
y2 = np.random.normal(0, 5, 1000) 6
# group the data together and combine into one dataframe
df1 = pd.DataFrame({'Group': 'Group1', 'Values': y1})
df2 = pd.DataFrame({'Group': 'Group2', 'Values': y2})
df_final = pd.concat([df1, df2])
fig = px.strip(df_final, x='Values', y='Group', color_discrete_sequence=['grey'])
quantiles_list = [0.05, 0.10, 0.25, 0.50, 0.75, 0.90, 0.95]
## this is a bit hacky and relies on y coordinates for groups starting from 0 and increasing by 1
y_diff = 0
## these store the coordinates in order to connect the quantile lines
lower_coordinates, upper_coordinates = [], []
for group_name in df_final.Group.unique():
for quantile in quantiles_list:
quantile_value = np.quantile(df_final[df_final['Group'] == group_name].Values, quantile)
if group_name == 'Group1':
lower_coordinates.append((quantile_value, 0.2 1*y_diff))
if group_name == 'Group2':
upper_coordinates.append((quantile_value, -0.2 1*y_diff))
fig.add_shape(
# Vertical Line for Group1
dict(
type="line",
x0=quantile_value,
y0=-0.2 1*y_diff,
x1=quantile_value,
y1=0.2 1*y_diff,
line=dict(
color="black",
width=4
)
),
)
y_diff = 1
## draw connecting lines
for idx in range(len(upper_coordinates)):
fig.add_shape(
dict(
type="line",
x0=lower_coordinates[idx][0],
y0=lower_coordinates[idx][1],
x1=upper_coordinates[idx][0],
y1=upper_coordinates[idx][1],
line=dict(
color="chocolate",
width=4
)
),
)
fig.show()