如何在python中将其随机切片为150bp长的片段?我想把它切成1000块,然后把每次的碎片集中在一起。这是为了模拟Illumina测序。你知道吗
以下是示例:
seq = 'ATGGAAAAAGAGTATACGATTGGATTAGATATTGGGACAAATTCGGTTGGATGGGCAGTGTTGACGGATG'
len(seq)=70
我想随机将这个字符串切成5个较小的字符串,固定长度为10,而不会弄乱字母的原始顺序。预期结果:
seq1= ['ATGGAAAAAG', 'AGTATACGAT', 'TGGATTAGAT', .......]
它是这样的:
seq1= seq[0:10] + seq[10:20] + seq[20:30] + seq[30:40] + seq[40:50]
但我希望它是随机的,而不是相邻的。你知道吗
对于seq[n:n+10],n是切片的起点。我需要它是随机的,也就是说我随机选取一个起始点,在那个起始点取出一个10bp长的DNA切片。然后我继续在随机的起点切割DNA。你知道吗
然后我需要一次又一次地做同样的切片,总共10次:
seq2=['', '', '', .....]
seq3=['', '', '', .....]
seq4=['', '', '', .....]
seq5=['', '', '', .....]
seq6=['', '', '', .....]
seq7=['', '', '', .....]
seq8=['', '', '', .....]
seq9=['', '', '', .....]
seq10=['', '', '', .....]
然后把序列1到序列10放在一起。你知道吗
谢谢你。你知道吗
我只需要选择一个随机的起点,然后从那里创建一个子串。 由于样本长度的原因,您的起点将排除最后150个字符。你知道吗
然后我会列一个清单,以便以后操作。你知道吗
(我在下面创建一个随机的DNA字符串进行测试。)
如果您需要多次执行此操作,您可以始终将上述内容放入函数中,然后执行以下操作:
相关问题 更多 >
编程相关推荐