我尝试在biopython
的循环中对大约10000对字符串运行成对全局对齐方法。每个字符串平均长度为20个字符。对一对序列运行该方法效果良好。但是在一个循环中运行这个,对于低至4对,会导致分段错误。如何解决这个问题?在
from Bio import pairwise2
def myTrial(source,targ):
if source == targ:
return [source,targ,source]
alignments = pairwise2.align.globalmx(source, targ,1,-0.5)
return alignments
sour = ['najprzytulniejszy', 'sadystyczny', 'wyrzucić', 'świat']
targ = ['najprzytulniejszym', 'sadystycznemu', 'wyrzucisz', 'świat']
for i in range(4):
a = myTrial(sour[i],targ[i])
分段错误不会发生,因为您正在使用循环,而是因为您正在为只接受ASCII字符串输入的对齐模式提供非ASCII字符作为输入。幸运的是,
Bio.pairwise2.align.globalmx
还允许对齐包含任意ASCII字符字符串和非ASCII字符的列表作为标记(即,将字符串列表,如['ABC', 'ABD']
与['ABC', 'GGG']
对齐,以产生如下对齐:或者在您的例子中,对齐非ASCII字符列表,如
^{pr2}$['ś', 'w', 'i', 'a', 't']
和['w', 'y', 'r', 'z', 'u', 'c', 'i', 's', 'z']
,以产生类似于用你的代码来完成这个
与
^{4}$所以作为一个输入
修改后的代码将生成
而不是分割错误。在
由于列表中的每个标记只有一个字符长,您还可以使用以下方法将结果对齐的列表转换回字符串:
在上面的例子中,
new_alignment
将是如你所愿。在
相关问题 更多 >
编程相关推荐