如何在NLTK中获取synset的wordnet感知频率？ - 问答 - Python中文网

如何在NLTK中获取synset的wordnet感知频率？

2024-10-02 20:40:19 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

根据文档，我可以在nltk中加载一个有意义的标记语料库：

>>> from nltk.corpus import wordnet_ic
>>> brown_ic = wordnet_ic.ic('ic-brown.dat')
>>> semcor_ic = wordnet_ic.ic('ic-semcor.dat')

我也可以得到这样的definition、pos、offset、examples：

>>> wn.synset('dog.n.01').examples
>>> wn.synset('dog.n.01').definition

但是如何从语料库中获取语法集的频率呢？要分解问题：

首先，如何计算一个语法集发生了多少次有意义标记的语料库？
然后下一步是用计数除以给定特定引理的所有出现的语法集的计数总数。

Tags：标记语法 examples wordnet dat 意义语料库 dog

0条回答

目前没有回答

相关问题更多 >

编程相关推荐

热门问题

热门文章