用O（k*N+k*Q）计算kmer的有效方法？

l, n , k, q = [int(x) for x in sys.stdin.readline().strip('\n').split(' ')] dna = '' for i in range(l): dna += sys.stdin.readline().strip('\n') mykmer =[] mycount = {} for i in range(q): kmer = sys.stdin.readline().strip('\n') mykmer.append(kmer) mycount[kmer]=0 current = dna[0:k] for j in range(k-1,len(dna)): if j != k-1: current = current[1:]+str(dna[j]) if current in mykmer: mycount[current] += 1 for x in mykmer: print(str(x)+' '+str(mycount[x]))

1条回答

网友

1楼 · 发布于 2024-09-26 18:16:43

我会改进你的内环：

for j in range(len(dna) - (len(dna) % k)):
    current = dna[j:j+k]
    if current in mycount:
        mycount[current] += 1

一次切片的成本低于重复切片和附加current = current[1:]+str(dna[j])成本高于dna[j:j+k]。因为它会导致3个字符串分配，而因为切片会导致一个字符串分配

使用您已有的词典而不是列表来进行成员资格测试。这就去掉了Q的因子

range(len(dna) - (len(dna) % k))确保循环不会不必要地考虑最后几个索引

用O（kN+kQ）计算kmer的有效方法？

相关问题更多 >

编程相关推荐

热门问题

热门文章

相关问题 更多 >

编程相关推荐

热门问题

热门文章

用O（kN+kQ）计算kmer的有效方法？

相关问题更多 >