python正则表达式重复字符

2024-09-30 10:28:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我希望在python中创建一个正则表达式,它匹配以T开头的18字符(任何字符),然后以AATTCC或{}开头的所有DNA序列。我可以处理第一部分,但我似乎找不到一种方法来编写结尾(双字符),而不复制regex 4次。 以下是以TT结尾的序列:

import re
seq='ATGTGTGGACACAAGTGACAGTTTACGATGAGGTTACAGCCCGCA'
match=re.findall('T.{18}TT',seq)
print match

Tags: 方法importrematch结尾序列字符seq
1条回答
网友
1楼 · 发布于 2024-09-30 10:28:25

签出a good tutorial。在

有一个概念叫做交替。它与任何给定选项匹配:

r'T.{18}(?:TT|AA|CC|GG)'

请注意,您应该使用原始字符串在Python中对regex进行编码,否则以后会遇到转义字符的问题。在

相关问题 更多 >

    热门问题