为什么这不能正确地分割流派？（Python）

dataGenre = data df5 = pd.DataFrame(data={"Genre":dataYearScore['Genre'], "Score": dataYearScore['Score']}) df5 = df5.assign(Genre=df5['Genre'].str.split(',')).explode('Genre').reset_index(drop=True) genre_list5 = [] avg_scores5 = [] for genre in df5["Genre"].unique(): genre_list5.append(genre) avg_scores5.append(df5.loc[df5["Genre"]==genre, "Score"].mean()) plt.bar(genre_list5, avg_scores5, width = 0.8) plt.xlabel('Genre') plt.ylabel('Average Score') plt.xticks(rotation=65) plt.title('Average Score for Each Genre') plt.show() df5 = pd.DataFrame(data={"Genre":genre_list5, "Score": avg_scores5}) df5

1条回答

网友

1楼 · 发布于 2024-10-05 14:24:29

由于comma之前或之后可能有一些空格分隔两种类型，因此需要使用正则表达式模式\s*,\s*和Series.str.split来正确分割Genres：

s = data[['Score']].assign(
    Genre=data['Genre'].str.split(r'\s*,\s*')).explode('Genre')
avg = s.groupby('Genre')['Score'].mean()

绘制平均评分：

avg.plot(kind='bar', width=0.8)
plt.ylabel('Average Rating')
plt.title('Average Score for Each Genre')

结果:

相关问题更多 >

编程相关推荐

热门问题

热门文章