2024-09-27 02:25:42 发布
网友
实际上我有fasta的文件,比如:
>seq1:QXQXQWQ:XQWQ ACTG >seq3:WCCWHWJ:WGH ATGC >seq7:GCGC:G ATGACA
我想去掉第一个“:”之后的所有东西,然后得到:
>seq1 ACTG >seq3 ATGC >seq7 ATGACA
如果可能的话,这和生物粒子有关吗?你知道吗
在带有SeqIO的biopython中很简单,只需通过适当地拆分字符串来修改record.id和record.description:
SeqIO
record.id
record.description
from Bio import SeqIO def yield_records(in_file): for record in SeqIO.parse(in_file, 'fasta'): record.description = record.id = record.id.split(':', 1)[0] yield record SeqIO.write(yield_records('in.fasta'), 'out.fasta', 'fasta')
在带有
SeqIO
的biopython中很简单,只需通过适当地拆分字符串来修改record.id
和record.description
:相关问题 更多 >
编程相关推荐