使用NLTK匹配两个字符串?

2024-10-05 12:23:09 发布

您现在位置:Python中文网/ 问答频道 /正文

因此,我试图编写一个程序,它将包含两个字符串,例如:

"I like pizza better cold"

以及

^{pr2}$

然后找出这两个东西是否匹配:

"I like pizza better cold"

以及

"Pizza really sucks."

上面的内容不匹配。在

我使用了Python可用的NLTK语言来实现这一点。我只是想知道,有没有人曾经做过类似的事情,并有什么建议?NLTK是正确的方法吗?我应该使用什么功能或规格?在

我在考虑将字符串拆分成标记,然后选择形容词和名词作为标记的主要方法,然后可能使用情绪分析算法来确定它是否为正,然后基于此匹配字符串。。。在

这只是一个小的副业项目,我正在做的乐趣,所以这里任何东西都将是有益的:)

干杯, 威尔


Tags: 方法字符串标记程序语言内容likebetter
1条回答
网友
1楼 · 发布于 2024-10-05 12:23:09

根据你的问题,你想比较两个句子,然后找出它们匹配的百分比。在

为了找出句子之间的相似性,可以使用Jaccard Similarity或{}。在

关于余弦相似性,请参考How to calculate cosine similarity given 2 sentence strings? - Python

如果余弦相似度小于,则句子也不相似;但如果余弦相似度接近1,则句子相似

NLTK可以用来查找句子中单词的同义词,这样就可以从句子中获得语义。在

要查找同义词,可以使用以下代码:

from nltk.corpus import wordnet as wn
wn.synsets(your word)

相关问题 更多 >

    热门问题