Biopython成对比对在循环中运行时会导致分段错误

from Bio import pairwise2 def myTrial(source,targ): if source == targ: return [source,targ,source] alignments = pairwise2.align.globalmx(source, targ,1,-0.5) return alignments sour = ['najprzytulniejszy', 'sadystyczny', 'wyrzucić', 'świat'] targ = ['najprzytulniejszym', 'sadystycznemu', 'wyrzucisz', 'świat'] for i in range(4): a = myTrial(sour[i],targ[i])

1条回答

网友

1楼 · 发布于 2024-06-25 05:43:29

分段错误不会发生，因为您正在使用循环，而是因为您正在为只接受ASCII字符串输入的对齐模式提供非ASCII字符作为输入。幸运的是，Bio.pairwise2.align.globalmx还允许对齐包含任意ASCII字符字符串和非ASCII字符的列表作为标记（即，将字符串列表，如['ABC', 'ABD']与['ABC', 'GGG']对齐，以产生如下对齐：

['ABC', 'ABD', '-'  ]
['ABC', '-'  , 'GGG']

或者在您的例子中，对齐非ASCII字符列表，如['ś', 'w', 'i', 'a', 't']和['w', 'y', 'r', 'z', 'u', 'c', 'i', 's', 'z']，以产生类似于

^{pr2}$

用你的代码来完成这个

alignments = pairwise2.align.globalmx(source, targ,1,-0.5)

与

^{4}$

所以作为一个输入

source = 'świat'
targ = 'wyrzucisz'

修改后的代码将生成

[(['ś', 'w', '-', '-', '-', '-', '-', 'i', 'a', 't', '-', '-'],
  ['-', 'w', 'y', 'r', 'z', 'u', 'c', 'i', '-', '-', 's', 'z'],
  2.0,
  0,
  12)]

而不是分割错误。在

由于列表中的每个标记只有一个字符长，您还可以使用以下方法将结果对齐的列表转换回字符串：

new_alignment = []

for aln in alignment:
    # Convert lists back into strings
    a = ''.join(aln[0])
    b = ''.join(aln[1])

    new_aln = (a, b) + aln[2:]
    new_alignment.append(new_aln)

在上面的例子中，new_alignment将是

[('św  -iat ', '-wyrzuci sz', 2.0, 0, 12)]

如你所愿。在

相关问题更多 >

编程相关推荐

热门问题

热门文章