注意自动正交简化的Seq2seq模型
ortografix的Python项目详细描述
奥托格拉菲克斯
欢迎使用ortografix,这是一个用于自动或逻辑简化的seq2seq模型,用Pythorc1.4编码。在
安装
通过pip:
pip3 install ortografix
或者,在git克隆之后:
^{pr2}$火车
要训练模型,请运行:
ortografix train \ --data /abs/path/to/training/data \ --model-type gru \ --shuffle \ --hidden-size 256\ --num-layers 1\ --bias \ --dropout 0\ --learning-rate 0.01 \ --epochs 10\ --print-every 100\ --use-teacher-forcing \ --teacher-forcing-ratio 0.5 \ --output-dirpath /abs/path/to/output/directory/whereto/save/model \ --with-attention \ --character-based
试验
定性评价
要定性地评估模型在给定开发/测试集中随机选择的10个句子的输出,请运行:
ortografix evaluate \ --data /abs/path/to/test/data.txt \ --model /abs/path/to/model/directory/ \ --random 10
定量评估
要定量评估给定开发/测试集上模型的输出,请运行:
ortografix evaluate \ --data /abs/path/to/test/data.txt \ --model /abs/path/to/model/directory
定量评估将返回:
- 在所有测试对上计算的所有编辑(Levenshtein)距离的总和
- 在所有测试对上计算的平均编辑距离
- 平均规格化编辑距离
- 平均归一化编辑相似度
所有度量通过textdistance计算。在
- 项目
标签: