擅长:python、mysql、java
<p>查找最长的染色体字符串,并创建一个空数组,其中每个染色体有一行,列一直到字典中最长的一行。然后它将每个染色体放入自己的行中,在那里可以对整个数组调用<code>np.where</code></p>
<pre><code>import numpy as np
longest_chrom = max([len(x) for x in seq_d.values()])
genome_data = np.zeros((len(seq_d), dtype=str, longest_chrom)
for index, entry in enumerate(seq_d):
gen_string = list(seq_d[entry]
genome_data[index, :len(gen_string) + 1] = gen_string
nuc_search = "T"
nuc_locs = np.where(genome_data == nuc_search)
</code></pre>
<p>使用这种方法,对于1个以上核苷酸的字符串,它略有不同,但我确信只需再多几个步骤就可以实现。在</p>