#pandas #dataframe
#pandas #фрейм данных
Вопрос:
Как мне извлечь значения из определенного столбца, которые отображаются ниже определенного порогового значения?
Этот код возвращает значение True для всех наблюдений, которые я хочу удалить:
df['City'].value_counts()<5
Этот код возвращает список всех отдельных наблюдений в столбце.
df['City'].value_counts().index.tolist()
Как мне объединить оба этих метода, чтобы получить список значений ‘City’, которые появляются менее 5 раз во фрейме данных?
Комментарии:
1. Если я правильно понимаю, вы
df.groupby('City').filter(lambda L: len(L) >= 5)
делаете то, что вам нужно? Или вы хотели:df['City'].value_counts()[lambda L: L >= 5]
?2.
s=df['City'].value_counts();df.loc[df.City.isin(s[s<5].index)]
3. @JonClements df[‘City’].value_counts()[лямбда L: L>= 5] это было то, чего я хотел. Спасибо