#python #pandas #dataframe #numpy #analytics
#python #pandas #фрейм данных #numpy #аналитика
Вопрос:
доброе утро!
Не могли бы вы мне помочь, пожалуйста, научив меня, как присвоить переменной выходные данные метода «describe»?
Спасибо и хорошего вам дня!
Комментарии:
1.
describe()
возвращает индексированный фрейм данных. таким образом, вы можете использоватьdf_cred_pd.describe().loc["25%", "vr_tx_jrs"]
best, чтобы не публиковать изображения в SO. Невозможно воспроизвести из изображений
Ответ №1:
pd.DataFrame.describe
возвращает фрейм данных, вы можете использовать loc для доступа к каждой ячейке фрейма данных или вы можете вычислить статистику напрямую.
import pandas as pd
from seaborn import load_dataset
df_tips = load_dataset('tips')
print(df_tips.describe())
Вывод:
total_bill tip size
count 244.000000 244.000000 244.000000
mean 19.785943 2.998279 2.569672
std 8.902412 1.383638 0.951100
min 3.070000 1.000000 1.000000
25% 13.347500 2.000000 2.000000
50% 17.795000 2.900000 2.000000
75% 24.127500 3.562500 3.000000
max 50.810000 10.000000 6.000000
Получение 25%:
df_tips.describe().loc['25%', 'total_bill']
#or
df_tips['total_bill'].quantile(.25)
Вывод:
13.3475
Получение 50%:
df_tips.describe().loc['50%', 'total_bill']
#or
df_tips['total_bill'].quantile(.50)
Вывод:
17.795
Ответ №2:
25% и 50% являются квантилями, поэтому вы можете просто использовать функцию pandas quantile
для получения этих значений.
Для всей информации, которую вы видите на describe
выходе, у вас есть функции, с pandas.DataFrame
которыми вы можете работать, например:
count -> pandas.DataFrame.count
mean -> pandas.DataFrame.mean
std -> pandas.DataFrame.std
min -> pandas.DataFrame.min
25%, 50%, 75% or any other quantile -> pandas.DataFrame.quantile
max -> pandas.DataFrame.max