Python按模式拆分字符串

网友

1楼 · 编辑于 2024-10-01 09:37:16

使用itertools.groupby怎么样？在

>>> s = 'aaaaabbbbbbbbbbbbbbccccccccccc'
>>> from itertools import groupby
>>> [''.join(v) for k,v in groupby(s)]
['aaaaa', 'bbbbbbbbbbbbbb', 'ccccccccccc']

这将把-作为自己的子串，很容易被过滤掉。在

^{pr2}$

网友

2楼 · 编辑于 2024-10-01 09:37:16

正则表达式MatchObject结果包括匹配项的索引。剩下的就是匹配重复字符：

import re

repeat = re.compile(r'(?P<start>[a-z])(?P=start)+-?')

仅当给定字母字符（a-z）至少重复一次时匹配：

^{pr2}$

匹配结果上的^{}和^{}方法提供了输入字符串中的确切位置。在

匹配项中包括破折号，但不包括非重复字符：

>>> for match in repeat.finditer("a-bb-cccccccc"):
...     print match.group(), match.start(), match.end()
... 
bb- 2 5
cccccccc 5 13

如果希望a-部分匹配，只需将+替换为*乘数：

repeat = re.compile(r'(?P<start>[a-z])(?P=start)*-?')

网友

3楼 · 编辑于 2024-10-01 09:37:16

str="aaaaabbbbbbbbbbbbbbccccccccccc"
p = [0] 
for i, c in enumerate(zip(str, str[1:])):
    if c[0] != c[1]:
        p.append(i + 1)
print p

# [0, 5, 19]

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python按模式拆分字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >