龙斯泰兹。一个有效的基于隐马尔可夫模型的结构化预测模型,用于序列标记任务。
rungsted的Python项目详细描述
##rungsted结构化感知器序列标记器
###安装
软件可通过pypi安装,例如do
` pip install rungsted `
###演示
存储库包含一个子集的词性标记布朗语料库。要在此数据集上运行结构化感知器标签,请执行:
python src/labeler.py --train data/brown.train --test data/brown.test.vw
龙斯泰兹的输入格式与Vowpal Wabbit的强大灵活的格式密切相关, 除了rungsted对于非整数的标签是完全正确的。###数据集
如果您有一个工作的nltk安装,您可以用这个命令重新创建brown数据集。
python rungsted/datasets/cr_brown_pos_data.py data/brown.train.vw data/brown.test.vw
还有一个脚本rungsted/datasets/conll_to_vw.py将conll格式的输入转换为rungsted
###构建并上传到pypi
首先,运行python setup.py sdist生成一个源发行版。 然后使用tween将分发文件上载到pypi:tween upload dist/*。
要在本地开发,请使用python setup.py develop。