根据文档,我可以在nltk中加载一个有意义的标记语料库:
>>> from nltk.corpus import wordnet_ic
>>> brown_ic = wordnet_ic.ic('ic-brown.dat')
>>> semcor_ic = wordnet_ic.ic('ic-semcor.dat')
我也可以得到这样的definition
、pos
、offset
、examples
:
>>> wn.synset('dog.n.01').examples
>>> wn.synset('dog.n.01').definition
但是如何从语料库中获取语法集的频率呢?要分解问题:
目前没有回答
相关问题 更多 >
编程相关推荐