Как присвоить переменной выходные данные метода «describe»?

#python #pandas #dataframe #numpy #analytics

#python #pandas #фрейм данных #numpy #аналитика

Вопрос:

доброе утро!

Не могли бы вы мне помочь, пожалуйста, научив меня, как присвоить переменной выходные данные метода «describe»?

введите описание изображения здесь

Спасибо и хорошего вам дня!

Комментарии:

1. describe() возвращает индексированный фрейм данных. таким образом, вы можете использовать df_cred_pd.describe().loc["25%", "vr_tx_jrs"] best, чтобы не публиковать изображения в SO. Невозможно воспроизвести из изображений

Ответ №1:

pd.DataFrame.describe возвращает фрейм данных, вы можете использовать loc для доступа к каждой ячейке фрейма данных или вы можете вычислить статистику напрямую.

 import pandas as pd
from seaborn import load_dataset

df_tips =  load_dataset('tips')
print(df_tips.describe())
 

Вывод:

        total_bill         tip        size
count  244.000000  244.000000  244.000000
mean    19.785943    2.998279    2.569672
std      8.902412    1.383638    0.951100
min      3.070000    1.000000    1.000000
25%     13.347500    2.000000    2.000000
50%     17.795000    2.900000    2.000000
75%     24.127500    3.562500    3.000000
max     50.810000   10.000000    6.000000
 

Получение 25%:

 df_tips.describe().loc['25%', 'total_bill']
#or
df_tips['total_bill'].quantile(.25)
 

Вывод:

 13.3475
 

Получение 50%:

 df_tips.describe().loc['50%', 'total_bill']
#or
df_tips['total_bill'].quantile(.50)
 

Вывод:

 17.795
 

Ответ №2:

25% и 50% являются квантилями, поэтому вы можете просто использовать функцию pandas quantile для получения этих значений.

Для всей информации, которую вы видите на describe выходе, у вас есть функции, с pandas.DataFrame которыми вы можете работать, например:

 count -> pandas.DataFrame.count
mean -> pandas.DataFrame.mean
std -> pandas.DataFrame.std
min -> pandas.DataFrame.min
25%, 50%, 75% or any other quantile -> pandas.DataFrame.quantile
max -> pandas.DataFrame.max