我有以下代码:
for k, (j,k) in enumerate (zip(line1_u,line2_u_rev_comp)):
if j==k:
Match1+=1
if j== 'N' or k == 'N':
Unknown1+=1
if j != k:
Different1+=1
这将获取2行(line1\u u和line2\u\u rev\u comp)并逐字符比较它们,以确定它们是否匹配、是否有一个N,该N将其置于未知类别或不同。我想要的是,将每一个字符汇总起来,以确定行中的10个或更多字符是否匹配。这怎么可能呢?对代码的解释将不胜感激。你知道吗
您应该查看itertools.groupby:
输出:
看看python中的difflib模块:https://docs.python.org/2/library/difflib.html。使用
find_longest_match
查找最长的公共子序列。你知道吗相关问题 更多 >
编程相关推荐