#python #pandas #dataframe #csv #matplotlib
#python #pandas #фрейм данных #csv #matplotlib
Вопрос:
Я делаю график с жанрами фильмов и их средними оценками, и это немного сложно понять из-за группировки всего этого. Мне было интересно, есть ли способ сделать его более презентабельным. Я думал, что это может помочь исключить любой жанр (либо полностью, либо в «другой» подмножество), но все мои попытки сделать это потерпели неудачу. Вот код, который я использовал для получения графика:
df5 = pd.DataFrame(data={"Genre":dataYearScore['Genre'], "Score": dataYearScore['Score']})
df5 = df5.assign(Genre=df5['Genre'].str.split(',')).explode('Genre').reset_index(drop=True)
genre_list5 = []
avg_scores5 = []
for genre in df5["Genre"].unique():
genre_list5.append(genre)
avg_scores5.append(df5.loc[df5["Genre"]==genre, "Score"].mean())
plt.bar(genre_list5, avg_scores5, width = 0.8)
plt.xlabel('Genre')
plt.ylabel('Average Score')
plt.xticks(rotation=65)
plt.title('Average Score for Each Genre')
plt.show()
Вот как выглядит мое изображение в настоящее время.
Любая помощь приветствуется 🙂
Ответ №1:
Попробуй это:
df5 = df5[df5['Score']<6]