nlpnet从哪里得到它的元数据pickle文件?

2024-06-25 22:54:18 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经安装了nlpnet(http://nilc.icmc.usp.br/nlpnet/),但找不到元数据_pos.泡菜它需要运行一个词性标记器。此文件似乎不在我的计算机上,也不包含在当前github存储库中。
有什么建议吗?在


Tags: 文件数据标记posbrgithubhttp计算机
2条回答

您需要下载nlpnet数据(PoS、SRL和依赖关系的模型)。它在http://nilc.icmc.usp.br/nlpnet/models.html上可用。PoS标记模型文件元数据_pos.泡菜在http://nilc.icmc.usp.br/nlpnet/data/pos-pt.tgz中提供

要训练模型,您需要每行一个句子的示例,其中标记和标记由下划线字符连接:

This_DT is_VBZ an_DT example_NN 

在语料库中使用这个命令,您将生成使用POS标记器所需的数据(包括元数据_pos.泡菜)公司名称:

^{pr2}$

如果你想使用一个已经训练过的模型,它们有一个here。可能是用其他语言语料库来评估的。在

相关问题 更多 >