海洛
我有一个序列,例如:
record_dict = SeqIO.to_dict(SeqIO.parse("sequence.fasta", "fasta"))
>sequence1
AAACCCGGGTTTAAACCCGGGTTTGGGTTTGGG
从这个序列中,我知道如何选择具有以下坐标的特定零件:
print(record_dict[sequence1].seq[coordinate_start:coordinate_end])
print(record_dict[sequence1].seq[3:7])
我得到:
CCCGG
但是如果我想把这个部分从
>sequence1
AAACCCGGGTTTAAACCCGGGTTTGGGTTTGGG
得到
>sequence1
AAACGTTTAAACCCGGGTTTGGGTTTGGG
有人有主意吗
谢谢你的帮助
这里有一个更好的例子
ACCGCTTTGAATCCGAGCTAG
---- ----
我想删除两个部分:
TCCG和GCTA与坐标相对应
11:14
和16:19
最后,我想删除这两个选项并获得:
>seq
ACCGCTTTGAAAG
您可以通过将所需的两个部分合并在一起来实现这一点:
请注意,为了切掉正确的部分,我在两个索引中都添加了1
如果要对多个零件执行此操作,可以通过在列表上循环执行此操作:
相关问题 更多 >
编程相关推荐