序列标记由平均感知器驱动。

sequence-tagging的Python项目详细描述


词性标注

使用平均感知器的词性标记器。

基于here

中的标记符

它使用以下功能:

  • 当前单词的后缀(最后3个字符)(未格式化)。
  • 当前单词的前缀(第一个字符)(未格式化)。
  • 当前单词。
  • 语音标记的前一部分和当前单词。
  • 语音标签的前一部分。
  • 前一个单词的词性标记。
  • 前两部分的语音标签。
  • 上一个词。
  • 上一个单词的后缀。
  • 两步后的单词。
  • 下一个词。
  • 下一个单词后缀。
  • 下一个单词后面的单词。
  • 偏倚

包括以下预训练模型。

  • POS标记器,接受过CONLL 2000分块数据培训
  • chunker,接受过conll 2000分块数据培训
  • 插槽填充器,接受ATIS数据培训

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何通过解决错误“活动无法转换为片段”将片段传递给类构造函数?   Java中清理Code39条码数据的regex帮助   将java转换为C++   java无法在Android Studio中生成签名的apk,出现错误   从数学方程出发   MySQL和Java内存问题   如何强制Java抛出算术异常?   java为什么JDBC将零端口视为空(默认)端口?   java如何在没有“changelog主题”的情况下加入KStream和KTable   排序我尝试合并两个排序的数组,但得到的是java。lang.ArrayIndexOutofBounds异常:5无法找出原因   如何在java中求大长度矩阵的逆?   基于maven构建的java生成类路径字符串   java每20个字符分割一个字符串,然后将每个部分打印到控制台   将字符串数字字转换为字符串数字:Java   在特定区域使用混合类型的java填充字节数组   尽管java类在开关块中实例化,但它只能调用接口方法