Создание новой переменной со средним значением категорий другой переменной

#python #replace

Вопрос:

У меня есть данные о домах, проданных в разных местах. Существуют переменная «почтовый индекс» и переменная «цена». Я должен предсказать для каждого объекта среднюю цену за относительный почтовый индекс.

 import pandas as pd  data = {"zipcode":[100, 100, 101, 101], "price":[500, 600, 800, 1000]} df = pd.DataFrame(data) df  

Я создаю серию со средней ценой за каждый почтовый индекс:

 zipcode_mprice = df.groupby(["zipcode"])["price"].mean() zipcode_mprice  

Как я могу создать новую переменную df[«pred_price»], которая дает мне среднюю цену относительного почтового индекса? Мне было сказано использовать функцию replace().

Спасибо!

Ответ №1:

Вы действительно можете объединить результат с фреймом данных:

 df = df.merge(zipcode_mprice, on= "zipcode" ) df.columns = ["zipcode","price","mean_zipcode"] df  

введите описание изображения здесь

Комментарии:

1. Большое вам спасибо!