命名实体分段

neseg的Python项目详细描述


Named Entity Segmentation

简介

本项目是字符串令牌流分割库; neseg -n 中国北京市联想科技有限公司 -d dict

功能

  • 字符串令牌解析;
  • 支持令牌流;
  • 解析器可以是自定义字典机械分割,每个token一个独立字典;
  • 解析器也可以是正则表达式;
  • 分割分正向和反向,都是从头开始;
  • 生成对应令牌名称和解析出来的字符创元组,最后剩下的归为一组;

应用场景

  • 各种名称的解析,如中文机构名、药品名称、地址的分割标注;

TODO

  • 设计参考re.scanner;
  • 可以用生成器yield来做技术实现;
  • 程序返回元组列表;

附录 - 源码文件说明

neseg
    /lib
        FMM.py  正向切词
        RMM.py  反向切词
    seg.py      
    main.py   主程序:无界面,参数命令行
changelog.md    软件更新日志
readme.md       软件使用、安装指南

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Springboot数据JPA findByDate()   java是否可以有多个顶级树节点?   javahibernatehql。子查询中的多个   使用Twilio验证java Keyclope电话号码   java重写对象的toString()表示返回意外的符号   java Android最多每15分钟调用一个方法,否则使用保存的数据   在java swing中突出显示jeditorpane中的一些单词   java将时间戳转换为UTC时区   由于main中存在ArrayIndexOutOfBoundsException,导致java编译错误   java如何通过requestscope获取对象内部对象的值?   java访问安卓代码内的网站并检索生成的图像   java这种日期格式的模式是什么?   java解析包含超链接的xml字符串