请给我几份校准文件。我使用正则表达式来提取那些有间隙的if检索(r“A-Z[A-Z]”,seq):获取有间隙的序列,例如M-------A。我的问题是在PYTHON中,如何得到在gap之前和之后的字符M和A? 这是我正在处理的文件的一个例子。非常感谢。你知道吗
3ENMA 113E84F72145D181 316 XRAY 2.350 0.215 0.269 no Dual specificity mitogen-activated protein kinase kinase 6 [Homo sapiens] ||3ENMB 3ENMC 3ENMD HHHHDYDIPTTENLYFQGAME----------------NFEVKADDLEPIMELGRGAYGVVEKMRHVPSGQIMA VKRIRATVNSQEQKRLLMDLDISMRTVDCPFTVTFYGALFREGDVWICMELMDTSLGIVKALEHLHSKLSVIHRDVKPSNVLINALGQVKMCDFGISGYLVDDVAKDIDAGCKPYMAPERINPELNQKGYSVKSDIWSLGITMIELAILRFPYDSWGTPFQQLKQVVEEPSPQLPADKFSAEFVDFTSQCLKKNSKERPTYPELMQHPFFT----------
您希望在由许多破折号组成的“gap”前后紧跟着大写字母
[A-Z]
。你知道吗所以正则表达式应该包含
([A-Z])-+([A-Z])
要提取这两个大写字符,可以使用
re.replace
和$1
以及$2
作为替换字符串的一部分。你知道吗相关问题 更多 >
编程相关推荐