用于对字符串进行近似匹配和语音匹配的库。

jeIlyfish的Python项目详细描述


https://travis-ci.org/jamesturk/jellyfish.svg?branch=masterhttps://coveralls.io/repos/jamesturk/jellyfish/badge.png?branch=masterhttps://img.shields.io/pypi/v/jellyfish.svgDocumentation Statushttps://ci.appveyor.com/api/projects/status/9xeyl1f5sd5pl40h?svg=true

水母是一个Python库,用于进行字符串的近似和语音匹配。

作者:詹姆斯·特克和迈克尔·斯蒂芬斯。

有关贡献者,请参见https://github.com/jamesturk/jellyfish/graphs/contributors

有关文档,请参见http://jellyfish.readthedocs.io

可在http://github.com/jamesturk/jellyfish找到源。

jellyfish>;=0.7只支持python 3,如果需要python 2,请使用0.6.x。

包含的算法

字符串比较:

  • Levenshtein距离
  • 距离
  • Jaro距离
  • Jaro Winkler距离
  • 匹配评分法比较
  • 汉明距离

拼音编码:

  • 美国Soundex
  • 变音
  • 纽约州身份和情报系统
  • 匹配等级代码

示例用法

>>> import jellyfish
>>> jellyfish.levenshtein_distance(u'jellyfish', u'smellyfish')
2
>>> jellyfish.jaro_distance(u'jellyfish', u'smellyfish')
0.89629629629629637
>>> jellyfish.damerau_levenshtein_distance(u'jellyfish', u'jellyfihs')
1
>>> jellyfish.metaphone(u'Jellyfish')
'JLFX'
>>> jellyfish.soundex(u'Jellyfish')
'J412'
>>> jellyfish.nysiis(u'Jellyfish')
'JALYF'
>>> jellyfish.match_rating_codex(u'Jellyfish')
'JLLFSH'

运行测试

如果你对水母感兴趣,你可以 在本地运行测试。水母使用tox来运行测试,您可以 设置并运行如下:

pip install tox
# cd jellyfish/
tox

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在reducer中迭代自定义可写组件时出现java问题   属性文件中属性的java命名约定   任务链关闭的java Executor服务   java从Eclipse中的字段生成多个构造函数   java通过继承读取Json   java在不知道密钥的情况下解析json   java camel cxf如何在电子邮件中发送soap请求响应   java程序似乎跳过了if语句的一部分,在移回正确位置之前先移到else语句   测试简单的Java加密/解密inputFileName不存在   java从Jenkins REST API获取所有作业的所有构建的构建细节   java基本包装器和静态“类型”类对象   在WebSphere8.5上部署java代码   java对象相等(对象引用“=”)   java MongoDB整型字段到枚举的转换   每次我重新导入gradle时,IntelliJ都会不断重置Java设置   类型使用键或索引从Java中的数据类型检索值   在Java的列表接口中需要listIterator()和iterator()是什么?