所以我读这篇文章是为了实现TF-IDFhttps://towardsdatascience.com/tfidf-for-piece-of-text-in-python-43feccaa74f8
在处理文本并计算TF,IDF和TF-IDF之后,我会得到一个字典,类似于
{'TFIDF_score': 0.0368605, 'doc_id': 1, 'key:' 'if'}
我的文字里的每一个字都被传递了
我的问题是:实现和计算此查询的最佳方法是什么?假设我的查询是'two'
。它的TFIDF_score
是0.9987384
。我是否应该为我的查询创建一个向量,并根据我的查询和我的文档id计算范数和点积(dot_prod(query, doc_id)
)
谢谢你的帮助。我很感激
目前没有回答
相关问题 更多 >
编程相关推荐