如何对具有多个字符串的.csv列进行排序（Python）

data = pd.read_csv('movies.csv') # read in file dataGenre = data df5 = pd.DataFrame(data={"Genre":dataYearScore['Genre'], "Score": dataYearScore['Score']}) genre_list5 = [] avg_scores5 = [] for genre in df5["Genre"].unique(): genre_list5.append(genre) avg_scores5.append(df5.loc[df5["Genre"]==genre, "Score"].mean()) plt.bar(genre_list5, avg_scores5, width = 0.8) plt.xlabel('Genre') plt.ylabel('Score') plt.xticks(rotation=65) plt.title('Average Score for Each Genre') plt.show()

2条回答

网友

1楼 · 编辑于 2024-10-05 14:26:35

我会这样做：

from collections import defaultdict
counter = defaultdict(list)

for idx, row in df5.iterrows():
    genres = row['Genre']
    score = row['Score']
    for genre in genres.split(','):
        counter[genre].append(score)

现在你有了每种类型的分数

网友

2楼 · 编辑于 2024-10-05 14:26:35

你可以使用分裂和爆炸

df = df.assign(Genre=df['Genre'].str.split(',')).explode('Genre').reset_index(drop=True)

相关问题更多 >

编程相关推荐

热门问题

热门文章