我有一个CSV文件(语料库.csv)在语料库中使用以下格式的分级摘要(文本):
Institute, Score, Abstract
----------------------------------------------------------------------
UoM, 3.0, Hello, this is abstract one
UoM, 3.2, Hello, this is abstract two and yet counting.
UoE, 3.1, Hello, yet another abstract but this is a unique one.
UoE, 2.2, Hello, please no more abstract.
我正在尝试用python创建一个KNN分类程序,它能够获得一个用户输入摘要,例如,“这是一个新的唯一摘要”,然后将这个用户输入摘要分类到最接近语料库(CSV)的地方,并返回预测摘要的分数/等级。我怎么才能做到呢?在
我有以下代码:
^{pr2}$在前面提到的代码中,如何使用TF-IDF计算中的特性进行KNN分类?(可能使用sklearn.NeighborsClassifier框架)
注:本申请案例的等级为摘要的相应分数/等级。在
我有视觉深度学习的背景,但是,我缺乏文本分类的知识,尤其是使用KNN。任何帮助都将不胜感激。提前谢谢你。在
KNN是一种分类算法-这意味着您必须有一个class属性。KNN可以使用TFIDF的输出作为输入矩阵-TrainX,但是对于数据中的每一行,仍然需要trany-the类。但是,你可以使用KNN回归。 用你的分数作为类变量:
“预测”将预测每个实例的分数。在
相关问题 更多 >
编程相关推荐