如何从nltk中用pl196x从Python中提取用于波兰语的引理?

2024-09-27 09:31:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我写了一些基本的程序,我想提取波兰语词引理什么是非常重要的,因为波兰语使用屈折。在

我正在创建一个简单的程序来加载数据并将单词转换为引理,但不知道如何操作:

from nltk import corpus

pl = corpus.pl196x
print dir(pl)
print iter(pl.tagged_words()).next()

我想用这种模棱两可的柠檬化方法(例如,在某些情况下,我可以忽略它):

^{pr2}$

如何在或nltk中使用pl196x来完成这项工作。在


语料库的源数据包含这样的词形变化和引理-因此,有可能但是如何访问它:

<w id="pu147125" lemma="kot" ana="SSNA---------P">kot</w>
<w id="pr021633" lemma="kot" ana="SSAA---------P">kota</w>
etc.

Tags: 数据fromimport程序iddircorpus单词

热门问题