假设我有一个带标记的语料库(比如brown语料库),我想提取只带'/nn'标记的单词。例如:
Daniel/np termed/vbd ``/`` extremely/rb conservative/jj ''/'' his/pp$ estimate/nn.....
这是标记语料库“brown”的一部分。我想做的是提取单词,比如-estimate(因为它用/nn标记)并将它们添加到一个列表中。但我发现的大多数例子都是关于标注语料库的。看到这些例子我真的很困惑。 有谁能帮我提供一个例子或教程,从标记的语料库中提取单词。在
提前谢谢。在
参见:http://nltk.googlecode.com/svn/trunk/doc/book/ch05.html
如果您只希望那些标记有
^{pr2}$NN
的,可以执行以下操作:编辑:
这里的
sent
是一个字符串减去省略号。在相关问题 更多 >
编程相关推荐