有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java中基于libsvm的svm文档分类

我正在使用libsvm库对简历进行文档分类。我有多份简历,我需要对它们进行分类。在这种情况下,我需要多标签分类还是多类别分类。上面的选项我应该考虑,也请提出一个方法来做?


共 (1) 个答案

  1. # 1 楼答案

    您的需求不是直接的,为了开发这样的系统,您需要想出几个步骤,例如:

    1. 你需要一组不同类型的文件(各种类型的简历)

    2. 然后,你需要确定哪些功能可以用来区分它们(根据什么(例如,简历长度、字数、简历标题内容等),你将如何区分它们)

    3. 然后你需要准备一组特征向量来训练SVM。(如果你只需要对相关和不相关的简历进行分类,这将是两个类别。如果有两个以上的类别,这将是多类别的,LibSVM支持多类别)

    4. 培训时,您需要执行缩放、交叉验证以提高准确性(read here

    5. 你需要完成以上步骤才能做出成功的预测