龙斯泰兹。一个有效的基于隐马尔可夫模型的结构化预测模型,用于序列标记任务。

rungsted的Python项目详细描述


[![生成状态](https://travis-ci.org/coastalcph/rungsted.svg?branch=master)](https://travis-ci.org/coastalcph/rungsted

##rungsted结构化感知器序列标记器

###安装

软件可通过pypi安装,例如do

` pip install rungsted `

###演示

存储库包含一个子集的词性标记布朗语料库。要在此数据集上运行结构化感知器标签,请执行:

python src/labeler.py --train data/brown.train --test data/brown.test.vw

龙斯泰兹的输入格式与Vowpal Wabbit的强大灵活的格式密切相关, 除了rungsted对于非整数的标签是完全正确的。

###数据集

如果您有一个工作的nltk安装,您可以用这个命令重新创建brown数据集。

python rungsted/datasets/cr_brown_pos_data.py data/brown.train.vw data/brown.test.vw

还有一个脚本rungsted/datasets/conll_to_vw.py将conll格式的输入转换为rungsted

###构建并上传到pypi

首先,运行python setup.py sdist生成一个源发行版。 然后使用tween将分发文件上载到pypi:tween upload dist/*

要在本地开发,请使用python setup.py develop。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
使用java的html并排表   如何修复Java(安卓)中的“找不到自由端口”错误   java为什么在以下代码中实现接口“onmapreadycallback”时出错?   java在Spring批处理中重置InMemory数据库   java非阻塞网络编程超时问题   安卓 Java:从UTF8字符串创建可绘制   java显示文本文件中包含的路径中的图像   gzipinputstream Java。伊奥。IOException:不是GZIP格式   java线程调度程序如何执行此代码?   java通过setFragmentResult将信息发送到另一个片段   java从任何地方进入活动   java如何使用SNMP4j开发用于搜索OID值的类   Java中的递归字符串索引超出范围错误(字符串索引超出范围异常)   缓存如何清除Java缓存中的特定文件?   java将构建任务添加到maven pom项目   java FileOutputStream非常慢   如果定义了父pom,则不会发生存储库url的java Maven属性替换