pythonregex：在模式匹配时拆分，这是一个空字符串

2条回答

网友

1楼 · 编辑于 2024-10-02 04:28:14

import regex
x="bazbarbarfoobar"
print regex.split(r"(?<!baz)(?=bar)",x,flags=regex.VERSION1)

您可以在这里使用^{}模块。在

或者

^{pr2}$

使用re.findall。在

See demo

网友

2楼 · 编辑于 2024-10-02 04:28:14

不幸的是，split需要一个非零宽度匹配，但是它还没有被修复，因为很多不正确的代码依赖于当前的行为，例如使用[something]*作为regex。使用这样的模式现在将生成一个FutureWarning，而那些从不可以拆分任何内容的模式，从python3.5以后的版本中抛出一个ValueError：

>>> re.split(r'(?<!foo)(?=bar)', 'foobarbarbazbar')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python3.6/re.py", line 212, in split
    return _compile(pattern, flags).split(string, maxsplit)
ValueError: split() requires a non-empty pattern match.

其思想是，在警告一段时间后，可以更改行为，以便正则表达式可以再次工作。在

如果不能使用regex模块，可以使用re.finditer()编写自己的拆分函数：

^{pr2}$

如果确定匹配项仅为零宽度，则可以使用拆分的开头以简化代码：

import re

def zerowidthsplit(pattern, string):
    splits = list(m.start() for m in re.finditer(pattern, string))
    starts = [0] + splits
    ends = splits + [ len(string) ]
    return [string[start:end] for start, end in zip(starts, ends)]

print(zerowidthsplit(r'(?<!foo)(?=bar)', 'foobarbarbazbar'))

相关问题更多 >

编程相关推荐

热门问题

热门文章

pythonregex：在模式匹配时拆分，这是一个空字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >