2024-09-29 22:22:05 发布
网友
我真的找不到我该如何训练一个支持向量机分类器的文本特征是非序数,可以是任何可能的字符串。 我连续使用这样一个带标签的数据集
Tajmahal | India | 21-08-1990
现在我使用toordinal()函数进行训练,但对字符串的特征提取一无所知
您应该将字符串列的每个不同值映射到一个数字标签。然后,为这些标签创建列,并根据该行对应字符串值的先兆指定0/1。 这称为一个热编码。您应该检查Scikit learn的CategoricalEncoding类。它为你做了大部分的工作
您应该将字符串列的每个不同值映射到一个数字标签。然后,为这些标签创建列,并根据该行对应字符串值的先兆指定0/1。
这称为一个热编码。您应该检查Scikit learn的CategoricalEncoding类。它为你做了大部分的工作
相关问题 更多 >
编程相关推荐