信息检索用雪球词干算法

PyStemmer的Python项目详细描述


词干算法

pystemmer提供了对计算 词干词的词干形式这是一种最常见的 形态末端被移除;希望代表一个共同的 语言基础形式。这在构建搜索引擎时最有用 和信息检索软件;例如,使用词干 enabled应该能够找到包含“cycling”的文档 查询“周期”。

pystemmer为几种语言(主要是欧洲语言)提供了算法, 通过在python中包装snowball项目中的libstemmer库 模块。

它还为 中文:虽然这已经被一个改进的算法所取代,但是 原始算法可能对信息检索感兴趣 希望重现早期实验结果的研究人员。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
用于读取OBS写入的java打开文件   java使用XFire通过ssl使用Web服务   java如何查看幸存者空间中的对象   不使用ActionListener从按钮执行java代码   java仅当用户执行某个操作时,如何清除应用程序的历史记录?   json无法反序列化'java'的实例。lang.Long`out-of-START\u对象标记;在弹簧靴柱上   JavaPOJO到OpenApi定义   java时间戳格式不显示不同的值   java Android:如何从片段切换到主要活动?   用于步进计数器/健身应用程序的java循环进度条   java Log4j更改特定记录器实例的记录器级别   JAVA中实现连接的数据结构   java Mockito静态函数mock   未找到java辅助技术:org。侏儒。可访问性。阿特克拉珀   java仅当列表中没有类似项时才向ArrayList添加项   java如何使用docx4j在word中添加合并字段?