Python用Numpy，ValueE生成随机dna序列

import numpy as np def random_dna_sequence(length): return ''.join(np.random.choice('ACTG') for _ in range(length)) with open('dna.txt', 'w+') as txtout: for _ in range(10): dna = random_dna_sequence(100) txtout.write(dna) txtout.write("\n") print (dna)

2条回答

网友

1楼 · 编辑于 2024-09-30 16:30:07

就随机序列函数而言，我得到了与mhawke相似的解决方案。然而，我正在生成一个与人类基因组1号染色体一样长的序列，而且我的方法花费了几乎一分钟的时间，所以我尝试了mhawke的方法，看看我是否有任何速度上的提高。相反，它花了大约10倍的时间。因此，对于处理大序列的任何人，我建议对return语句进行以下更改：

BASES = ('A', 'C', 'G', 'T')
def random_dna_sequence(length):
    return ''.join(np.random.choice(BASES, length))

这基本上让numpy执行循环，它做的效率更高。我希望这有帮助。在

网友

2楼 · 编辑于 2024-09-30 16:30:07

对于问题的第一部分，请将a作为列表传递：

def random_dna_sequence(length):
    return ''.join(np.random.choice(list('ACTG')) for _ in range(length))

或者将基定义为列表或元组：

^{pr2}$

第二部分有一个类似的解决方案：将概率作为列表或元组传递：

BASES = ('A', 'C', 'T', 'G')
P = (0.2, 0.2, 0.3, 0.3)

def random_dna_sequence(length):
    return ''.join(np.random.choice(BASES, p=P) for _ in range(length))

相关问题更多 >

编程相关推荐

热门问题

热门文章