范式学习与范式预测

paradigmextract的Python项目详细描述


注意!在

这是Språkbanken的paradigmextract库的非正式版本。 主版本可以找到here。在

————————————————————————————————————————————————————————————————————

范式学习与范式预测

此存储库中的软件集合与 范式学习与范式预测的科学研究 以下出版物是最新的出版物。参见参考列表 对于以前的工作。在

[Forsberg,M;Hulden,M.(2016年)。学习传感器模型 从实例屈折的形态分析。在诉讼中 国家统计局。计算语言学协会

快速参考

范式学习:pextract.py

说明

从输入屈折表中提取范例表示。看到了吗 Forsberg和Hulden(2016)第2节。在

示例

$ python src/pextract.py < data/es_verb_train.txt > es_verb.p

非概率形态分析仪:morphanalyzer.py

说明

从一个范例创建一个与foma兼容的形态学分析器 文件。分析仪是非概率的。在

选项:

  • -o重新创建原始数据(所有变量都必须精确实例化,如训练数据中所示)
  • -c通过泛化约束变量(默认pvalue=0.05)
  • -u无约束(所有变量都定义为?+)在
  • -p与-c一起使用
  • -s将不同的分析器分开,而不是与合并 优先级联合(某些分析仪可能需要)
  • -n要编译到的二进制foma文件的名称

可使用上述任何组合。分析仪组合在一起 通过优先级联合,例如-o -c -u将生成一个分析器 [ Goriginal .P. Gconstrained .P. Gunconstrained ]。在

示例

$ python src/morphanalyzer.py -o -c es_verb.p > es_verb.foma

概率形态分析仪:morphparser.py

说明

从一个范例创建一个概率形态分析器 文件。在

从STDIN和读取一个或多个空格分隔的单词 以以下格式返回集合的最合理的分析: SCORE NAME_OF_PARADIGM VARIABLES WORDFORM1:BASEFORM,MSD#WORDFORM2:BASEFORM,MSD...

标志:

  • -k num打印k个最佳分析
  • -t打印整个表以进行最佳分析
  • -d打印调试信息
  • -n num使用n阶ngram模型选择最佳范式(范式中的变量使用n元模型)

示例

$ echo "coger cojo" | python morphparser.py ./../paradigms/spanish_verbs.p -k 1 -t

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在Android Studio中使用while循环显示包含textview对象的数据   创建名为“userController”的bean时发生java错误:通过字段“userService”表示未满足的依赖关系   java PDFBox PDFImageWrite。writeImage未正确处理所有字符   java无法识别代码中的nzec错误   无法更改java TabLayout字体   在Java中使用子字符串删除部分字符串   Java中的listener addPropertyChangeListener方法   java可以同时拖动多个对象   java如何将数组中的值添加到向量中   java为什么在Camel 3.7.3中无法正确计算属性?   与后端问题不同的机器中的java客户端资源   带字符串的java分割字节数组?   java On_选项_项目_选择的方法说明   java如何在画布的父画中画一个圆?   连接超时和打开连接数的java Netty通道配置   java mysql中如何防止向数据库中插入重复数据   升级到macOS Big Sur后,java无法启动Neo4j控制台应用程序   在Java中使用XSLT将XML转换为HTMLString的ajax   java无法使用Apache POI获取Excel工作表中的数据