范式学习与范式预测
paradigmextract的Python项目详细描述
注意!在
这是Språkbanken的paradigmextract库的非正式版本。 主版本可以找到here。在
————————————————————————————————————————————————————————————————————
范式学习与范式预测
此存储库中的软件集合与 范式学习与范式预测的科学研究 以下出版物是最新的出版物。参见参考列表 对于以前的工作。在
[Forsberg,M;Hulden,M.(2016年)。学习传感器模型 从实例屈折的形态分析。在诉讼中 国家统计局。计算语言学协会
快速参考
范式学习:pextract.py
说明
从输入屈折表中提取范例表示。看到了吗 Forsberg和Hulden(2016)第2节。在
示例
$ python src/pextract.py < data/es_verb_train.txt > es_verb.p
非概率形态分析仪:morphanalyzer.py
说明
从一个范例创建一个与foma兼容的形态学分析器 文件。分析仪是非概率的。在
选项:
-o
重新创建原始数据(所有变量都必须精确实例化,如训练数据中所示)-c
通过泛化约束变量(默认pvalue=0.05)-u
无约束(所有变量都定义为?+)在-p
与-c一起使用-s
将不同的分析器分开,而不是与合并 优先级联合(某些分析仪可能需要)-n
要编译到的二进制foma文件的名称
可使用上述任何组合。分析仪组合在一起
通过优先级联合,例如-o -c -u
将生成一个分析器
[ Goriginal .P. Gconstrained .P. Gunconstrained ]
。在
示例
$ python src/morphanalyzer.py -o -c es_verb.p > es_verb.foma
概率形态分析仪:morphparser.py
说明
从一个范例创建一个概率形态分析器 文件。在
从STDIN和读取一个或多个空格分隔的单词
以以下格式返回集合的最合理的分析:
SCORE NAME_OF_PARADIGM VARIABLES WORDFORM1:BASEFORM,MSD#WORDFORM2:BASEFORM,MSD...
标志:
-k num
打印k个最佳分析-t
打印整个表以进行最佳分析-d
打印调试信息-n num
使用n阶ngram模型选择最佳范式(范式中的变量使用n元模型)
示例
$ echo "coger cojo" | python morphparser.py ./../paradigms/spanish_verbs.p -k 1 -t
- 项目
标签: