示例文件如下所示(全部放在一行中,为便于阅读而包装):
['>1\n', 'TCCGGGGGTATC\n', '>2\n', 'TCCGTGGGTATC\n',
'>3\n', 'TCCGTGGGTATC\n', '>4\n', 'TCCGGGGGTATC\n',
'>5\n', 'TCCGTGGGTATC\n', '>6\n', 'TCCGTGGGTATC\n',
'>7\n', 'TCCGTGGGTATC\n', '>8\n', 'TCCGGGGGTATC\n','\n',
'$$$\n', '\n',
'>B1\n', 'ATCGGGGGTATT\n', '>B2\n', 'TT-GTGGGAATC\n',
'>3\n', 'TTCGTGGGAATC\n', '>B4\n', 'TT-GTGGGTATC\n',
'>B5\n', 'TTCGTGGGTATT\n', '>B6\n','TTCGGGGGTATC\n',
'>B7\n', 'TT-GTGGGTATC\n', '>B8\n', 'TTCGGGGGAATC\n',
'>B9\n', 'TTCGGGGGTATC\n','>B10\n', 'TTCGGGGGTATC\n',
'>B42\n', 'TT-GTGGGTATC\n']
$$$
将两个集合分开。我需要使用.strip
函数并删除\n
和所有的“headers”。你知道吗
我需要做一个列表(如下所示),并用Z替换“-”(同样,全部放在一行上;为了清晰起见,请包装在这里):
[['TCCGGGGGTATC','TCCGTGGGTATC','TCCGTGGGTATC', 'TCCGGGGGTATC',
'TCCGTGGGTATC',CGTGGGTATC','TCCGTGGGTATC', 'TCCGGGGGTATC'],
['ATCGGGGGTATT', 'TT-GTGGGAATC','TTCGTGGGAATC', 'TT-GTGGGTATC',
'TTCGTGGGTATT', 'TTCGGGGGTATC','TT-GTGGGTATC', 'TTCGGGGGAATC',
'TTCGGGGGTATC', 'TTCGGGGGTATC','TT-GTGGGTATC]]
这里是摩西·科莱多耶的答案的一个变体,它检查了
>
的第一个字符,并丢弃任何匹配项以及任何空元素。我还包括将“-”替换为“Z”。你知道吗这避免了为任何元素的长度指定任何特定的意义。你知道吗
您可以利用较小长度的头(和其他不需要的项)作为筛选它们的标准。首先创建一个包含一个列表的列表,并将通过长度测试的项附加到内部列表中。你知道吗
当到达分隔符
'$$$'
时,新的子列表被添加到结果列表中,并且长度测试再次用于将剩余项添加到此新的子列表中:相关问题 更多 >
编程相关推荐