2024-10-02 12:31:30 发布
网友
我正在为句子分类任务研究SNLI数据集here。此数据集包含两个句子,并且需要判断第二个句子是否包含,与相矛盾还是中性。在
为了进行分类,我实现了基于连续矩阵的支持向量机分类,准确率在70%左右。在
有人可以建议任何其他NLP相关的分类策略,即使用bigrams或trigrams,因为我需要找到一些基线。在
您应该考虑使用k-means集群,对于这种类型的任务来说,这听起来有点不传统,但是按照下面的方法使用它,您可能会得到一个可靠的基线结果。在
(可选)您可以通过对训练数据运行PCA来进一步提高模型的精度。这基本上与你的特征脱节,这可以减少噪音。在
您应该考虑使用k-means集群,对于这种类型的任务来说,这听起来有点不传统,但是按照下面的方法使用它,您可能会得到一个可靠的基线结果。在
(可选)您可以通过对训练数据运行PCA来进一步提高模型的精度。这基本上与你的特征脱节,这可以减少噪音。在
相关问题 更多 >
编程相关推荐