Fuzzy正则表达式：替换的Fuzzy计数始终为1

2条回答

网友

1楼 · 编辑于 2024-07-04 07:28:04

从regex模块文档中：

By default, fuzzy matching searches for the first match that meets the given constraints.

在您的例子中，第一个匹配是使用GAG并执行一次替换来获得的（因为GAG在GAT之前进行了尝试）。您可以使用BESTMATCH标志来查找最佳匹配：

import regex

dna_patt = regex.compile("((GAG|GAT)(TCT|GAA)(GCC|GGG|GGT)){s<=1}", regex.BESTMATCH)
sequence = "GATGAAGGG"

print(dna_patt.search(sequence))

它给出：

<regex.Match object; span=(0, 9), match='GATGAAGGG'>

网友

2楼 · 编辑于 2024-07-04 07:28:04

您还可以使用字符类将G或T与GA[GT]匹配，以便第一次找到GAT

如果以后不需要捕获组，可以使用(?:使它们成为非捕获组

import regex

dna_patt = regex.compile("(?:GA[GT](?:TCT|GAA)(?:GCC|GG[GT])){s<=1}")
sequence = "GATGAAGGG"

print(dna_patt.search(sequence))

结果

<regex.Match object; span=(0, 9), match='GATGAAGGG'>

Python demo

相关问题更多 >

编程相关推荐

热门问题

热门文章

Fuzzy正则表达式：替换的Fuzzy计数始终为1

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >