Pyspark HashingTF对待“鸡蛋罐”和“鸡蛋罐”是一样的吗?

2024-09-24 06:35:46 发布

您现在位置:Python中文网/ 问答频道 /正文

某些代码未按预期工作。看起来HashingTF函数正在为具有完全相同单词的字符串返回相同的哈希值,而不管单词的顺序如何。有人能证实吗?你知道吗

hashingTF = HashingTF(inputCol=mytokenizer.getOutputCol(), 
outputCol="features")

Tags: 函数字符串代码顺序单词features证实outputcol