通过访问Uniprot(使用Python)获取蛋白质序列

2024-09-24 22:26:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个蛋白质id列表,我正在尝试使用python从Uniprot访问蛋白质序列。 我看到了这篇文章:Protein sequence from uniprot protein id python但给出了元素列表,而不是实际的序列:

代码

import requests as r
from Bio import SeqIO
from io import StringIO

cID='P04637'

baseUrl="http://www.uniprot.org/uniprot/"
currentUrl=baseUrl+cID+".fasta"
response = r.post(currentUrl)
cData=''.join(response.text)

Seq=StringIO(cData)
pSeq=list(SeqIO.parse(Seq,'fasta'))

其输出:

输出

[SeqRecord(seq=Seq('MQAALIGLNFPLQRRFLSGVLTTTSSAKRCYSGDTGKPYDCTSAEHKKELEECY...SSS', SingleLetterAlphabet()), id='sp|O45228|PROD_CAEEL', name='sp|O45228|PROD_CAEEL', description='sp|O45228|PROD_CAEEL Proline dehydrogenase 1, mitochondrial OS=Caenorhabditis elegans OX=6239 GN=prdh-1 PE=2 SV=2', dbxrefs=[])]

我只是好奇如何才能真正得到序列本身


Tags: fromimportid列表序列prod蛋白质sp