全部的

ducut的Python项目详细描述


电商分词

安装

pip install ducut

使用方式

fromducutimportDuCutresource_path='<自定义的资源文件>'dc=DuCut(resource_path)line='万斯 板鞋白红'cu=dc.cut_query(line)print(f"brand:{cu.brand},series:{cu.series},color:{cu.color},category:{cu.category},word:{cu.word},proper:{cu.proper}")# 加载自定义词典dc.add_word_file("<词典路径>")# 加载自定义单词dc.add_word('川久保玲')

思路

  • 语义实体:主要用于一些系统尚未识别的实体词,干预后,该词的切分总是能保持一致,不受其所在的上下文影响。
  • 语义切分:用于指定在特定上下文中,短语的切分方式,而不影响该短语在其他上下文中的切分方式

参考资料

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
httpclient java。网SocketException:将json负载发布到rest api时管道破裂(写入失败)   java如何获取类名?   java有界泛型类型和仅父类型之间的区别是什么?   复杂形状的java冲突检测   java是否可以从列表的特定元素映射到self?   子类的java大小   java在2D数组中的特定位置替换字符?   安全性如何创建Java沙盒?   使用JPA存储库的spring批处理ItemWriter的java持久化问题   java如何从自己的自动配置中使用WebMvcConfigurationSupport   Java Spring 3 MVC控制器显式加载服务   java Pentaho删除了SolutionRepositoryService服务?   java无法从firebase检索数据   序列化可以“序列化”吗在Java中使用注释的对象   java无法在服务中自动连接假客户端   java使用数组内部的乘法从另一个数组填充数组   为什么JavaAPI不为我们提供用于当前环境的有界队列实现?   java如何使用commons ImapClient获取有用的邮件信息?不仅仅是布尔状态,而是真实信息?   Java NIO:allocate或allocateDirect,当我每次写入SocketChannel时创建ByteBuffer时