NLTK的WordNet中synset的上一个词列表不完整?

2024-10-01 09:24:28 发布

您现在位置:Python中文网/ 问答频道 /正文

当我试图通过WN NLTK的接口恢复任何给定的WordNet synset的超链接时,我得到了我认为与WN的web搜索界面不同的结果。例如:

from nltk.corpus import wordnet as wn
bank6ss = wn.synsets("bank")[5]  # 'bank' as gambling house funds
bank6ss.hypernyms()
# returns [Synset('funds.n.01')]

也就是说,只找到一个上一个词(没有其他的,例如,instance_hypernyms())的。{不过,当你看到其他超人的名字时,}

^{pr2}$

什么能解释这种差异,我怎么能在NLTK的WordNet中得到更长的一系列的同名词呢?

在我的NLTK安装中使用的WordNet版本是3.0。


Tags: fromweb界面ascorpuswordnetbankfunds
1条回答
网友
1楼 · 发布于 2024-10-01 09:24:28

我刚刚意识到,我看到的是两种不同类型的输出:NLTK WordNet中返回的是一个hyperymsynsetSynset['funds.n.01']),而web界面中的超链接列表是由属于该语法集的引理组成的。在

为了完全回答这个问题,这个引理列表可以在NLTK中恢复如下:

from nltk.corpus import wordnet as wn
bank6ss = wn.synsets("bank")[5]  # 'bank' as gambling house funds
hn1ss = bank6ss.hypernyms()[0]
hn1ss.lemmas()
# returns [Lemma('funds.n.01.funds'), 
#   Lemma('funds.n.01.finances'),
#   Lemma('funds.n.01.monetary_resource'), 
#   Lemma('funds.n.01.cash_in_hand'),
#   Lemma('funds.n.01.pecuniary_resource')]

或者,如果只对引理名感兴趣:

^{pr2}$

相关问题 更多 >