Фильтровать данные из созданного списка

#python #pandas #filtering

#python #pandas #фильтрация

Вопрос:

Я работаю над своим набором данных Covid из github, и я хотел бы отфильтровать свой набор данных по странам, которые отображаются в списке this EU_member в формате csv.

 import pandas as pd

df = pd.read_csv('https://raw.githubusercontent.com/owid/covid-19-data/master/public/data/owid-covid-data.csv')
df = df[df.continent == 'Europe']

# From here I want to  just pick those countries that appear in the following list:
EU_members= ['Austria','Italy','Belgium''Latvia','Bulgaria','Lithuania','Croatia','Luxembourg','Cyprus','Malta','Czechia','Netherlands','Denmark','Poland','Estonia',
'Portugal','Finland','Romania','France','Slovakia','Germany','Slovenia','Greece','Spain','Hungary','Sweden','Ireland']

# I have tried something like this but it is not what I expected:
df.location.str.find('EU_members')
  

Комментарии:

1. Какой у вас вопрос по этому поводу?

2. Как отфильтровать набор данных, содержащий только страны, которые я создал в списке EU_member.

Ответ №1:

Вы можете использовать .isin() :

 import pandas as pd

df = pd.read_csv('https://raw.githubusercontent.com/owid/covid-19-data/master/public/data/owid-covid-data.csv')

EU_members= ['Austria','Italy','Belgium''Latvia','Bulgaria','Lithuania','Croatia','Luxembourg','Cyprus','Malta','Czechia','Netherlands','Denmark','Poland','Estonia',
'Portugal','Finland','Romania','France','Slovakia','Germany','Slovenia','Greece','Spain','Hungary','Sweden','Ireland']


df_out = df[df['location'].isin(EU_members)]
df_out.to_csv('data.csv')
  

Создает data.csv :

введите описание изображения здесь