快速带状编辑距离

tinyalign的Python项目详细描述


Travis

丁尼亚林

一个提供编辑距离(又称Levenshtein distance,即 是,计算插入、删除和替换)和汉明距离 计算。在

它的主要目的是通过 允许指定最大差异数maxdiff(分带)。如果 提供该参数后,返回的编辑距离精确到 maxdiff。也就是说,如果实际编辑距离大于maxdiff,则 返回大于maxdiff的值,但不一定是实际的编辑 距离。在

对于计算常规编辑距离,或者如果您的maxdiff小于4,则 应该更喜欢https://github.com/fujimotos/polyleven,就这样 在这种情况下更快。当maxdiff为4或更多,但不太接近 长度最短的串,这个模块比较快。在

>>> from tinyalign import edit_distance, hamming_distance
>>> edit_distance("banana", "ananas")
2
>>> hamming_distance("hello", "yello")
1
>>> edit_distance("hello", "world", maxdiff=2)
3

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java JavaFX SwingWorker等价物?   java如何检查一个字符串只包含数字和一个小数点?   java遇到了异常组织。阿帕奇。卡塔琳娜。LifecycleException:无法启动组件   java如何从日期格式获取最低计时单位?   java应用服务器与开发过程的集成   java我无法运行Junit测试   无法在java多线程处理中维护生产者任务的顺序   java如何在CLI应用程序中“拦截”Ctrl+C?   java如何使用JSch进行原子SFTP文件传输,以便在写入过程完成之前无法访问该文件?   java当用户摆弄html范围滑块时,如何更改内容(文本)?   如何在Java中向现有文件追加文本?   JUnit测试中的java模拟Apache驼峰位置   java Maven更新项目和依赖项