我已经成功地检索到通过其他语义关系连接到基synset的synsets,如下所示:
wn.synset('good.a.01').also_sees()
Out[63]:
[Synset('best.a.01'),
Synset('better.a.01'),
Synset('favorable.a.01'),
Synset('good.a.03'),
Synset('obedient.a.01'),
Synset('respectable.a.01')]
wn.synset('good.a.01').similar_tos()
Out[64]:
[Synset('bang-up.s.01'),
Synset('good_enough.s.01'),
Synset('goodish.s.01'),
Synset('hot.s.15'),
Synset('redeeming.s.02'),
Synset('satisfactory.s.02'),
Synset('solid.s.01'),
Synset('superb.s.02'),
Synset('well-behaved.s.01')]
然而,反义词关系似乎有所不同。我设法检索到连接到我的基本语法集的引理,但无法检索实际的synset,如下所示:
^{pr2}$我怎么能得到语法集,而不是引理,它通过反义词连接到我的基本语法集-wn.synset公司('good.a.01')?TIA公司
由于某些原因,WordNet在引理级别索引}是多对多还是一对一关系。在
antonymy
关系,而不是Synset(参见http://wordnetweb.princeton.edu/perl/webwn?o2=&o0=1&o8=1&o1=1&o7=&o5=&o9=&o6=&o3=&o4=&s=good&i=8&h=00001000000000000000000000000000#c),所以问题是Synsets
和{在歧义词的情况下,一个词多个意思,我们在字符串到-
Synset
之间有一对多的关系,例如在一个意义/概念,多重表示的情况下,我们在
^{pr2}$Synset
-到String之间有一对多的关系(其中String指的是引理名):注意:到目前为止,我们比较的是字符串与}和{}之间的关系。在
Synsets
而不是{“可爱”的是
Lemma
和String有一对一的关系:Lemma
对象的_name
属性返回unicode字符串,而不是列表。从代码点:https://github.com/nltk/nltk/blob/develop/nltk/corpus/reader/wordnet.py#L202和https://github.com/nltk/nltk/blob/develop/nltk/corpus/reader/wordnet.py#L444似乎引理和Synset有一对一的关系。来自https://github.com/nltk/nltk/blob/develop/nltk/corpus/reader/wordnet.py#L220的docstring:
所以我们可以这样做,并且知道每个
Lemma
对象只会返回1个synset:假设你正在尝试做一些情感分析,你需要WordNet中每个形容词的反义词,你可以很容易地接受反义词的语法集:
相关问题 更多 >
编程相关推荐