用于对字符串进行近似匹配和语音匹配的库。

my3n-test1-jellyfish的Python项目详细描述


https://travis-ci.org/jamesturk/jellyfish.svg?branch=masterhttps://coveralls.io/repos/jamesturk/jellyfish/badge.png?branch=masterhttps://img.shields.io/pypi/v/jellyfish.svgDocumentation Statushttps://ci.appveyor.com/api/projects/status/9xeyl1f5sd5pl40h?svg=true

水母是一个Python库,用于进行字符串的近似和语音匹配。

作者:詹姆斯·特克和迈克尔·斯蒂芬斯。

有关贡献者,请参见https://github.com/jamesturk/jellyfish/graphs/contributors

有关文档,请参见http://jellyfish.readthedocs.io

可在http://github.com/jamesturk/jellyfish找到源。

jellyfish>;=0.7只支持python 3,如果需要python 2,请使用0.6.x。

包含的算法

字符串比较:

  • Levenshtein距离
  • 距离
  • Jaro距离
  • Jaro Winkler距离
  • 匹配评分法比较
  • 汉明距离

拼音编码:

  • 美国Soundex
  • 变音
  • 纽约州身份和情报系统
  • 匹配等级代码

示例用法

>>> import jellyfish
>>> jellyfish.levenshtein_distance(u'jellyfish', u'smellyfish')
2
>>> jellyfish.jaro_distance(u'jellyfish', u'smellyfish')
0.89629629629629637
>>> jellyfish.damerau_levenshtein_distance(u'jellyfish', u'jellyfihs')
1
>>> jellyfish.metaphone(u'Jellyfish')
'JLFX'
>>> jellyfish.soundex(u'Jellyfish')
'J412'
>>> jellyfish.nysiis(u'Jellyfish')
'JALYF'
>>> jellyfish.match_rating_codex(u'Jellyfish')
'JLLFSH'

运行测试

如果你对水母感兴趣,你可以 在本地运行测试。水母使用tox来运行测试,您可以 设置并运行如下:

pip install tox
# cd jellyfish/
tox

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用ApachePOI将excel文件导入postgreSQL表   java多线程从iText pdf提取文本   winapi Java和SetWindowDisplayAffinity   eclipse juno的java Websphere 6.1插件   java MPAndroidChart:为Y轴提供一些偏移   java中作为参数传递枚举类型的继承   java Gui jframe的工作原理与netbeans不同   使用Bouncy Castle和PDFBox在Java中验证PDF签名   优化缩小Java代码   java无法在安卓中从Firebase取回子数据   返回的java方法?我应该什么时候用?   java错误处理已完成,退出代码为1。与穿过阵列的for循环有关   多线程Java volatile是否阻止缓存或强制执行写缓存?   java Multi-collectItems如何提前终止并返回已收集的项目   java为什么不在服务(请求,响应)中直接调用processRequest(请求,响应)?   java如何从字符串生成int数组?   打印获取用户输入的值并在其他预选文本中显示。JAVA   未显示java DynamicAsper UTF8字符   java Eclipse RCP:不启动应用程序的命令行参数