我正在创建一个电影推荐系统使用协同过滤,并创建了10个最推荐的熊猫数据帧电影列表
我就是这样创造的:
movie_titles=pd.DataFrame(movieID)
movie_titles.columns=['movieId', 'title', 'genres']
df=pd.merge(df, movie_titles, on='movieId')
ratings=pd.DataFrame(df.groupby('title')['rating'].mean())
ratings['num of ratings']=pd.DataFrame(df.groupby('title')['rating'].count())
moviemat=df.pivot_table(index='userId', columns='title', values='rating')
movie_user_ratings=moviemat[movielens_title]
similar_to_movie=moviemat.corrwith(movie_user_ratings)
corr_movie=pd.DataFrame(similar_to_movie, columns=['Correlation'])
corr_movie=corr_movie.join(ratings['num of ratings'])
collab_ratings=corr_movie[corr_movie['num of ratings']>100][corr_movie['Correlation']<1].sort_values('Correlation',ascending=False).head(10)
我的输出是:
我试图提取标题列,但我不断得到一个关键错误。能帮我点忙吗
目前没有回答
相关问题 更多 >
编程相关推荐