2024-09-30 10:28:25 发布
网友
我希望在python中创建一个正则表达式,它匹配以T开头的18字符(任何字符),然后以AA、TT、CC或{}开头的所有DNA序列。我可以处理第一部分,但我似乎找不到一种方法来编写结尾(双字符),而不复制regex 4次。 以下是以TT结尾的序列:
T
18
AA
TT
CC
import re seq='ATGTGTGGACACAAGTGACAGTTTACGATGAGGTTACAGCCCGCA' match=re.findall('T.{18}TT',seq) print match
签出a good tutorial。在
有一个概念叫做交替。它与任何给定选项匹配:
r'T.{18}(?:TT|AA|CC|GG)'
请注意,您应该使用原始字符串在Python中对regex进行编码,否则以后会遇到转义字符的问题。在
签出a good tutorial。在
有一个概念叫做交替。它与任何给定选项匹配:
请注意,您应该使用原始字符串在Python中对regex进行编码,否则以后会遇到转义字符的问题。在
相关问题 更多 >
编程相关推荐