Udmurt文本的部分语言标记实用程序

udmurttagger的Python项目详细描述


本模块包含一个Udmurt文本词性标记的实用程序。 该工具基于LSTM神经网络,考虑了词序。在

安装

该工具可与pip一起安装

pip3 install udmurttagger

注意:必须单独下载实用程序的模型。 由于项目规模的限制,我无法放置它 在github或PiPy上。启动程序后,它将下载 打开模型的包装。你不需要采取行动。但你呢 需要150兆的互联网连接 交通。在

使用示例

一次标注一个句子

^{pr2}$

标签集

基于UDMURT CORPORA的标记集

  • 形容词
  • 形容词代词
  • 副词
  • 副词代词
  • CNJ-连词
  • IMIT-视频电话
  • INTRJ-感叹词
  • 名词
  • NUM-数字
  • 插入词
  • 部分-粒子
  • PN-专有名词(名词的子类型)
  • 后置
  • PREDIC-谓语
  • 前代词
  • 动词

有关详细信息,请参见page。在

型号

此工具可用于消除基于规则的标记的歧义。在

你可以自己包装训练过的模型。在

模型评估:损失:0.2281-acc:0.9845-val U损失:0.2643-val U acc:0.9782。在

联系人

您可以通过电子邮件联系项目的设计者:

Boris Orekhov(nevmenandr)

@gmail

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java OnResizeListener或OnDrawListener或类似的东西   java Orika映射嵌套子列表   保存时java Heroku请求超时代码H12   数据库在Java中出现socket读取超时异常的原因是什么?   java如何更改来自Sqlite数据库的特定数据在Listview中的行颜色   java JAXB解组器无法正确处理XML中的列表   java Android日期时区让我抓狂   java不透明属性在Swing中如何工作?   eclipse从JavaEE代码生成流程图   java如何在Hibernate中从相关表中获取计数   java Glassfish部署了项目的依赖项库   java使内容适合JavaFx中的WebView   java不满意的链接错误libcrypto。所以1.0.0   循环中java数组的使用   java找出哪个包调用服务