因此,我试图编写一个程序,它将包含两个字符串,例如:
"I like pizza better cold"
以及
^{pr2}$然后找出这两个东西是否匹配:
"I like pizza better cold"
以及
"Pizza really sucks."
上面的内容不匹配。在
我使用了Python可用的NLTK语言来实现这一点。我只是想知道,有没有人曾经做过类似的事情,并有什么建议?NLTK是正确的方法吗?我应该使用什么功能或规格?在
我在考虑将字符串拆分成标记,然后选择形容词和名词作为标记的主要方法,然后可能使用情绪分析算法来确定它是否为正,然后基于此匹配字符串。。。在
这只是一个小的副业项目,我正在做的乐趣,所以这里任何东西都将是有益的:)
干杯, 威尔
根据你的问题,你想比较两个句子,然后找出它们匹配的百分比。在
为了找出句子之间的相似性,可以使用}。在
Jaccard Similarity
或{关于余弦相似性,请参考How to calculate cosine similarity given 2 sentence strings? - Python
如果余弦相似度小于,则句子也不相似;但如果余弦相似度接近1,则句子相似
NLTK可以用来查找句子中单词的同义词,这样就可以从句子中获得语义。在
要查找同义词,可以使用以下代码:
相关问题 更多 >
编程相关推荐