Difflib SequenceMatcher如何为多个字符的相似性确定“equal”?

2024-10-01 17:39:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我编写了一个Python模块,它区分了两个HTML源代码。 我在比较文本时遇到了一个小问题difflib.SequenceMatcher函数将文本确定为“相等”,即使只有一个字符相似。 因此,像“123456”和“abc1de”这样的泛型值将归类为插入的“abc”,等于1=1,并替换de中的23456

总之,如果相等长度超过3个字符,如何确定设置“相等”分类?你知道吗


Tags: 模块函数文本源代码html分类de字符

热门问题