sklearn中nDCG的输入

2024-09-28 01:25:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我无法理解sklearn nDcg的输入格式:http://sklearn.apachecn.org/en/0.19.0/modules/generated/sklearn.metrics.ndcg_score.html

目前我有以下问题:我有多个查询,每个查询的排名概率都计算成功了。但现在的问题是计算测试集的nDCG,我想使用sklearn nDCG。链接上给出的示例

>>> y_true = [1, 0, 2]
>>> y_score = [[0.15, 0.55, 0.2], [0.7, 0.2, 0.1], [0.06, 0.04, 0.9]]
>>> ndcg_score(y_true, y_score, k=2)
1.0

根据网站的说法,你的真实是真实的,你的分数是概率。所以以下是我的问题:

  1. 这个例子是针对一个查询还是多个查询?在
  2. 如果这只是一个查询,那么你真的代表什么:原始排名?在
  3. 如果这是一个单一的查询,为什么我们有多个输入概率?在
  4. 如何将此方法应用于多个查询及其结果概率?在

Tags: orgmodulestruehttp格式sklearn概率generated
1条回答
网友
1楼 · 发布于 2024-09-28 01:25:32

你可以看到它类似于一个多类分类问题。在

所以回答你的问题

  1. Is this example for just one query or multiple queries?

一个查询

  1. If this is for just one query then what does y_true represents: original rankings?

我将它称为文档的相关标签,因为它可能有重复的值。在

  1. If this is for a single query and why we have multiple input probabilites?

y_score是属于某个类的文档的概率分布。在您的示例中,y_score = [[0.15, 0.55, 0.2], [0.7, 0.2, 0.1], [0.06, 0.04, 0.9]]表示第0个文档属于类1(0.55是最大值),第一个文档属于类0(0.7是最大值),第二个文档属于类2(0.9是最大值)。缺少文档,示例也有误导性。如果有四份文件就更好了。在

  1. How this method can be applied to multiple queries and their resultant probabilites?

然后,您可以在多个查询中平均每个查询的nDCG分数。在

相关问题 更多 >

    热门问题