在python中,如何将字符串拆分为每个部分只包含相同字符的部分

2024-10-01 00:32:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我想得到一个DNA序列作为一个字符串,我需要把字符串分割成一个字符串的一部分列表。和每个部分必须包含相同的字符只有。还有最终输出必须是一个列表,按照使用python3.4的原始序列的顺序

例如:-infected ="AATTTGCCAAA" 我需要得到如下输出

Modified.  = ['AA','TTT','G','CC','AAA' ]

Tags: 字符串列表顺序序列字符dnaaacc
2条回答
def fchar(ch,mi):
    global numLi
    fc=ch
    li=""
    for c in infected[mi:]:
        if fc==c :
            li+=fc
            mi = mi+1
        else:
            break

    if mi<len(infected) :
        return li+" "+fchar(infected[mi],mi)
    else:
        return li

infected =input("Enter DNA sequence\n") ;#"AAATTTTTTTTGCCCCCCA"
x=fchar(infected[0],0)         
newSet = x.split(' ')
print(newSet)

这就是^{}的用途:

>>> from itertools import groupby
>>> infected ="AATTTGCCAAA"
>>> 
>>> [''.join(g) for _,g in groupby(infected)]
['AA', 'TTT', 'G', 'CC', 'AAA']

相关问题 更多 >