2024-09-23 20:23:46 发布
网友
我有均聚物,是重复的,如ACACAC,GTGT等
我如何在python中使用regex查找这样的模式。例如
seq = 'ACCTTAAAGG' x = [(m.group(), m.start()) for m in re.finditer(r'([ACGT])\1{2,}', seq) if len(m.group()) > 3]
查找长度大于3的A或T或G或C的重复。在
你能建议我如何使用正则表达式来重复AT,CG,AG,…等类型吗
您可以使用以下regex (AC){3,}|(AG){3,}|(GC){3,}|(GT){3,}
(AC){3,}|(AG){3,}|(GC){3,}|(GT){3,}
>>> import re >>> s = 'ACACACCTTAACGCGCGAGGCGCGCGC' >>> pat = re.compile(r'(AC){3,}|(AG){3,}|(GC){3,}|(GT){3,}') >>> [(m.group(), m.start()) for m in re.finditer(pat, s)] [('ACACAC', 0), ('GCGCGCGC', 19)]
您可以使用以下regex
(AC){3,}|(AG){3,}|(GC){3,}|(GT){3,}
相关问题 更多 >
编程相关推荐