擅长:python、mysql、java
<p>就随机序列函数而言,我得到了与mhawke相似的解决方案。然而,我正在生成一个与人类基因组1号染色体一样长的序列,而且我的方法花费了几乎一分钟的时间,所以我尝试了mhawke的方法,看看我是否有任何速度上的提高。相反,它花了大约10倍的时间。因此,对于处理大序列的任何人,我建议对return语句进行以下更改:</p>
<pre><code>BASES = ('A', 'C', 'G', 'T')
def random_dna_sequence(length):
return ''.join(np.random.choice(BASES, length))
</code></pre>
<p>这基本上让numpy执行循环,它做的效率更高。我希望这有帮助。在</p>