更改seqID并删除阵列后的零件

2024-09-27 02:25:42 发布

您现在位置:Python中文网/ 问答频道 /正文

实际上我有fasta的文件,比如:

>seq1:QXQXQWQ:XQWQ
ACTG
>seq3:WCCWHWJ:WGH
ATGC
>seq7:GCGC:G
ATGACA

我想去掉第一个“:”之后的所有东西,然后得到:

>seq1
ACTG
>seq3
ATGC
>seq7
ATGACA

如果可能的话,这和生物粒子有关吗?你知道吗


Tags: 文件生物粒子fastaseq1atgcwghseq7
1条回答
网友
1楼 · 发布于 2024-09-27 02:25:42

在带有SeqIO的biopython中很简单,只需通过适当地拆分字符串来修改record.idrecord.description

from Bio import SeqIO

def yield_records(in_file):
    for record in SeqIO.parse(in_file, 'fasta'):
        record.description = record.id = record.id.split(':', 1)[0]
        yield record

SeqIO.write(yield_records('in.fasta'), 'out.fasta', 'fasta')

相关问题 更多 >

    热门问题