更改seqID并删除阵列后的零件 - 问答 - Python中文网

更改seqID并删除阵列后的零件

2024-09-27 02:25:42 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

实际上我有fasta的文件，比如：

>seq1:QXQXQWQ:XQWQ
ACTG
>seq3:WCCWHWJ:WGH
ATGC
>seq7:GCGC:G
ATGACA

我想去掉第一个“：”之后的所有东西，然后得到：

>seq1
ACTG
>seq3
ATGC
>seq7
ATGACA

如果可能的话，这和生物粒子有关吗？你知道吗

Tags：文件生物粒子 fasta seq1 atgc wgh seq7

1条回答

网友

1楼 · 发布于 2024-09-27 02:25:42

在带有SeqIO的biopython中很简单，只需通过适当地拆分字符串来修改record.id和record.description：

from Bio import SeqIO

def yield_records(in_file):
    for record in SeqIO.parse(in_file, 'fasta'):
        record.description = record.id = record.id.split(':', 1)[0]
        yield record

SeqIO.write(yield_records('in.fasta'), 'out.fasta', 'fasta')

相关问题更多 >

编程相关推荐

热门问题

热门文章