所以我使用gensim为NLP任务构建了一个自定义分类器。现在我有两个简单的数组,测试集(majorityVoteArray)和分类器的预测(similarityArray)。在
我可以很容易地使用sklearn获得“获取混淆矩阵”和准确度报告:
confusion_matrix(majorityVoteArray, similarityArray)
classification_report(majorityVoteArray, similarityArray))
然而,这些都没有包含任何关于我的结果的意义的信息。然而,由于这是一个针对大文本的分类任务,我的测试集有点小,所以我相当怀疑。有没有一种像上述函数一样容易进行显著性检验的方法?在
如果有帮助,我有构建测试集的interrater agreement分数的结果:
^{pr2}$
目前没有回答
相关问题 更多 >
编程相关推荐