python中txt文件的过滤

>ENSG00000100206|ENST00000216024|DMC1|2371|38568257;38570043|38568289;38570286 CTCAGACGTCGGGCCGACGCAAGGCCACGCGCGCGAACACACAGGTGCGGCCCCGGGCCA CACGCACACCGTACAC >ENSG00000001630|ENST00000003100|CYP51A1|3210|92134365|92134530 TATATCACAGTTTCTTTCTTTTTTTTTTTTTTTTTTTTGAGACAGAGTTTTGCTCTTGTT GCCCAGGCTGGAGTACAGTGACGCAATCTCGGCTCACTGCAACCTTTGCCTCCCAGGTTC >ENSG00000100206|ENST00000216024|DMC1|2371|38568257;38570043|38568289;38570286 TTAACTATAATCCCACTGCCTATTTTTTTATTTCTAAAAATATCATAAAAAGACACAAAA

1条回答

网友

1楼 · 发布于 2024-10-03 23:23:52

您可以从使用Biopython获得适当的FASTA格式解析器开始：http://biopython.org/wiki/SeqIO

然后遍历这些记录，并对它们执行所需的操作。这不仅可以节省您编写解析器的时间，还可以防止您完全出错。你知道吗

这一页的例子：

from Bio import SeqIO
for record in SeqIO.parse("example.fasta", "fasta"):
    print(record.id)

不要打印，而是创建一个dict{record.id: record.length}，只有当长度较长时才更新它。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章