AttributeError:“unicode”对象没有属性“wup\u similarity”

from nltk.corpus import wordnet as wn listsyn1 = [] listsyn2 = [] for synset in wn.synsets('dog', pos=wn.NOUN): print synset.name() for lemma in synset.lemmas(): listsyn1.append(lemma.name()) for synset in wn.synsets('paw', pos=wn.NOUN): print synset.name() for lemma in synset.lemmas(): listsyn2.append(lemma.name()) countsyn1 = len(listsyn1) countsyn2 = len(listsyn2) sumofsimilarity = 0; for firstgroup in listsyn1: for secondgroup in listsyn2: print(firstgroup.wup_similarity(secondgroup)) sumofsimilarity = sumofsimilarity + firstgroup.wup_similarity(secondgroup) averageofsimilarity = sumofsimilarity/(countsyn1*countsyn2)

1条回答

网友

1楼 · 发布于 2024-09-30 01:34:48

相似性度量只能由Synset对象而不是Lemma或{}（即str类型）访问。在

dog = wn.synsets('dog', 'n')[0]
paw = wn.synsets('paw', 'n')[0]

print(type(dog), type(paw), dog.wup_similarity(paw))

[出来]：

^{pr2}$

当您获得.lemmas()并从Synset对象访问.names()属性时，您将得到str：

dog = wn.synsets('dog', 'n')[0]
print(type(dog), dog)
print(type(dog.lemmas()[0]), dog.lemmas()[0])
print(type(dog.lemmas()[0].name()), dog.lemmas()[0].name())

[出来]：

<class 'nltk.corpus.reader.wordnet.Synset'> Synset('dog.n.01')
<class 'nltk.corpus.reader.wordnet.Lemma'> Lemma('dog.n.01.dog')
<class 'str'> dog

您可以使用hasattr函数检查哪些对象/类型可以访问某个函数或属性：

dog = wn.synsets('dog', 'n')[0]
print(hasattr(dog, 'wup_similarity'))
print(hasattr(dog.lemmas()[0], 'wup_similarity'))
print(hasattr(dog.lemmas()[0].name(), 'wup_similarity'))

[出来]：

True
False
False

最有可能的是，您需要一个类似于https://github.com/alvations/pywsd/blob/master/pywsd/similarity.py#L76的函数，它可以最大化跨两个synset的wup_similarity，但请注意，有许多注意事项，如预词素化是必要的。在

所以我想你应该用.lemma_names()来避免它。或许，你可以这样做：

def ss_lnames(word):
    return set(chain(*[ss.lemma_names() for ss in wn.synsets(word, 'n')]))

dog_lnames = ss_lnames('dog')
paw_lnames = ss_lnames('paw')

for dog_name, paw_name in product(dog_lnames, paw_lnames):
    for dog_ss, paw_ss in product(wn.synsets(dog_name, 'n'), wn.synsets(paw_name, 'n')):
        print(dog_ss, paw_ss, dog_ss.wup_similarity(paw_ss))

但最有可能的结果是不可解释和不可靠的，因为在synset-lookup-bot之前，在外循环和内环中没有词义消歧。在

相关问题更多 >

编程相关推荐

热门问题

热门文章