java中基于libsvm的svm文档分类 1 周,5 日 Questions & Answers 437 我正在使用libsvm库对简历进行文档分类。我有多份简历,我需要对它们进行分类。在这种情况下,我需要多标签分类还是多类别分类。上面的选项我应该考虑,也请提出一个方法来做?
# 1 楼答案 您的需求不是直接的,为了开发这样的系统,您需要想出几个步骤,例如: 你需要一组不同类型的文件(各种类型的简历) 然后,你需要确定哪些功能可以用来区分它们(根据什么(例如,简历长度、字数、简历标题内容等),你将如何区分它们) 然后你需要准备一组特征向量来训练SVM。(如果你只需要对相关和不相关的简历进行分类,这将是两个类别。如果有两个以上的类别,这将是多类别的,LibSVM支持多类别) 培训时,您需要执行缩放、交叉验证以提高准确性(read here ) 你需要完成以上步骤才能做出成功的预测
# 1 楼答案
您的需求不是直接的,为了开发这样的系统,您需要想出几个步骤,例如:
你需要一组不同类型的文件(各种类型的简历)
然后,你需要确定哪些功能可以用来区分它们(根据什么(例如,简历长度、字数、简历标题内容等),你将如何区分它们)
然后你需要准备一组特征向量来训练SVM。(如果你只需要对相关和不相关的简历进行分类,这将是两个类别。如果有两个以上的类别,这将是多类别的,LibSVM支持多类别)
培训时,您需要执行缩放、交叉验证以提高准确性(read here )
你需要完成以上步骤才能做出成功的预测