2024-09-24 06:35:46 发布
网友
某些代码未按预期工作。看起来HashingTF函数正在为具有完全相同单词的字符串返回相同的哈希值,而不管单词的顺序如何。有人能证实吗?你知道吗
hashingTF = HashingTF(inputCol=mytokenizer.getOutputCol(), outputCol="features")
是的。HashingTF将输入视为“单词包”(与词序无关)。如果“包”是一样的,你得到的哈希值也是一样的。你知道吗
是的。HashingTF将输入视为“单词包”(与词序无关)。如果“包”是一样的,你得到的哈希值也是一样的。你知道吗
相关问题 更多 >
编程相关推荐