Каково соотношение мужчин и женщин для каждого занятия с использованием Панд

#python

Вопрос:

 df = pd.read_csv('https://raw.githubusercontent.com/justmarkham/DAT8/master/data/u.user', sep ='|')
df.head()

df.groupby(["occupation", "gender"])["occupation"].count()  
 

На выходе я получаю количество каждого F и M, но как мне рассчитать соотношение?

Ответ №1:

Если вам нужно соотношение полов в каждой профессии, попробуйте это —

 df.groupby(["occupation"])["gender"].value_counts(normalize=True) * 100
 

Далее, если вы хотите, чтобы они были в табличном формате, распакуйте результаты в виде —

 (df.groupby(["occupation"])["gender"].value_counts(normalize=True) * 100).unstack('gender', fill_value=0)