DNA分析中使用正则表达式进行模式匹配时python中的For循环问题

import re def find_seq(filename): with open(filename) as file: seq='' for line in file: header = re.search(r'^>\w+', line) if(header): print (header.group()) seq = seq.replace('\n','') find_Lpattern = re.sub(r'.*AAA', '',seq) find_Rpattern = re.sub(r'TTT.*', '',find_Lpattern) if(find_Rpattern): print (find_Rpattern) seq = '' else: seq += line filename = 'test.txt' print(find_seq(filename))

1条回答

网友

1楼 · 发布于 2024-09-29 17:19:54

即使假设你的缩进设置的方式能产生你描述的结果，你的逻辑是错的。在处理累积的seq之前，您正在打印页眉。在

当您读取文件的第1行时，headerregexp匹配。此时，seq是空字符串。因此，它打印匹配项，并对空字符串运行replace和re.sub调用。在

然后它读取第2行，“aaactacgcgttt”，并将其附加到seq。在

然后显示第3行，“>；seq2”。头与你的头匹配。然后in对seq运行replace和sub调用，这仍然是第2行中的“aaactacgcgttt”。在

在打印头之前，您需要将seq处理移动到，并考虑当您在没有找到最终头的情况下运行文件结尾时会发生什么-在for循环结束后，您仍将有要解析和打印的“seq”内容。在

或者看看第三方biopattern库，它有^{}模块来解析FASTA文件。在

相关问题更多 >

编程相关推荐

热门问题

热门文章