评估基于内容的推荐系统(没有“用户”)

2024-04-19 01:05:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用FIFA 2020数据集为足球运动员构建一个基于内容的RecSys。在这种情况下,球员是“项目”,他们的得分(头球能力、运球技巧、位置得分等)是“评分”。我已经创建了余弦相似性矩阵来对每个玩家的相似性分数进行排序。我的模型只是为了做到这一点:对于任何给定的玩家,我的模型将显示前5名最相似的其他玩家

我现在正处于评估我的模型的阶段,并且面临一些问题。在线阅读了一些资料后,我发现我可能无法使用RMSE或MAE等统计指标。更合适的方法是精度和召回率(或者更具体地说,平均精度图)

问题是,所有这些评估指标都需要实际用户来验证(例如,实际选择克里斯蒂亚诺·罗纳尔多作为与莱昂内尔·梅西“正确”相似的球员)。回到原始数据集,它不像电影分级/亚马逊项目那样,项目实际上是由不同的用户分级的——FIFA 2020只是每个球员的分数和属性的集合。因此,我无法“预测”另一个用户对另一个玩家的评分,也无法根据该评分进行推荐

因此,我想问一下,是否有其他建议来评估我的模型,就推荐的类似玩家的“正确性”而言?再一次,我的模型的目标是显示任何给定玩家最相似的前5名玩家。


Tags: 数据项目用户模型内容玩家精度评分