Разделить два фрейма данных, сопоставив часть строк в индексе

#pandas #multi-index

#pandas #многоиндексный

Вопрос:

Пожалуйста, помогите, почему df3 не работает? получена ошибка «слияние с перекрытием более одного уровня для мультииндекса не реализовано»

исходные данные:
Фамилия Имя Год Cat Pay 0 Джонсон Дэвид 2020 Яблоко 100 1 Птица Деми 2020 Яблоко 60 2 Птица Деми 2019 Банан 100 3 Джонсон Дэвид 2019 Банан 100

df1=df.groupby([‘LastName’, ‘FirstName’]) [‘Pay’].agg([‘min’, ‘max’, ‘mean’, ‘sum’])

df2 = df.groupby([‘Фамилия’,’Имя’,’Год’])[‘Платить’].mean()

df3=pd.DataFrame() df3[«PCT»] = df1[‘mean’]/df2

Комментарии:

1. Привет! У вас будет больше шансов получить помощь, если вы сможете предоставить нам некоторый полный код для воспроизведения вашей проблемы. А также предоставить нам желаемый результат.

2.ссылка курсив жирный import pandas as pd df=pd.read_excel("hello.xls") df1=df.groupby(['LastName', 'FirstName']) ['Pay'].agg(['min','max', 'mean', 'sum']) df2 = df.groupby(['LastName','FirstName','Year'])['Pay'].mean() df3=pd.DataFrame() df3["PCT"] = df1['mean']/df2

3. Вместо комментария, пожалуйста, попробуйте отредактировать свой первоначальный вопрос. Приведите краткий пример того, как выглядит ваш фрейм данных. Трудно сказать, как выглядят ваши данные, когда вы загружаете внешний файл. Вы можете, например, показать нам первые 5-10 строк ваших данных. Сделайте все это как редактирование вашего исходного сообщения. Также включите то, что вы пробовали до сих пор, и желаемый результат.