擅长:python、mysql、java
<p>我给你准备了生物疗法的解决方案。我将首先假设你的genbank文件与一个基因组序列有关,然后我将提供一个不同的解决方案,假设它是一个基因序列。事实上,如果你知道你在处理哪一个问题,那会很有帮助的。在</p>
<p><strong>基因组序列分析:</strong></p>
<p>从文件中解析自定义genbank flatfile的方法是:</p>
<pre><code>from Bio import SeqIO
record = SeqIO.read("yourGenbankFileDirectory/yourGenbankFile.gb","genbank")
</code></pre>
<p>如果只需要原始序列,则:</p>
^{pr2}$
<p>现在,您可能需要此序列的名称,以便在生成.fasta之前给序列一个“>;header”。让我们看看genbank.gb文件的名称:</p>
<pre><code>nameSequence = record.features[0].qualifiers
</code></pre>
<p>这将返回一个字典,其中包含由genbank文件的作者注释的整个序列的各种同义词</p>
<p><strong>基因序列分析:</strong></p>
<p>从文件中解析自定义genbank flatfile的方法是:</p>
<pre><code>from Bio import SeqIO
record = SeqIO.read("yourGenbankFileDirectory/yourGenbankFile.gb","genbank")
</code></pre>
<p>要获得基因的原始序列列表/所有基因的列表,则:</p>
<pre><code>rawSequenceList = [gene.extract(record.seq.tostring()) for gene in record.features]
</code></pre>
<p>获取每个基因序列的名称列表(更准确地说是每个基因的同义词词典)</p>
<pre><code>nameSequenceList = [gene.qualifiers for gene in record.features]
</code></pre>