基于非有序文本特征的svm分类器训练

2024-09-29 22:22:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我真的找不到我该如何训练一个支持向量机分类器的文本特征是非序数,可以是任何可能的字符串。 我连续使用这样一个带标签的数据集

Tajmahal | India | 21-08-1990

现在我使用toordinal()函数进行训练,但对字符串的特征提取一无所知


Tags: 数据函数字符串文本分类器特征标签向量
1条回答
网友
1楼 · 发布于 2024-09-29 22:22:05

您应该将字符串列的每个不同值映射到一个数字标签。然后,为这些标签创建列,并根据该行对应字符串值的先兆指定0/1。
这称为一个热编码。您应该检查Scikit learn的CategoricalEncoding类。它为你做了大部分的工作

相关问题 更多 >

    热门问题