如何使用以“（）”作为分隔符的re模块拆分字符串？

网友

1楼 · 编辑于 2024-09-27 17:46:59

分隔符必须与要在之间删除的字符串部分相匹配。这有点棘手，因为(和)是组字符，但这里是：

text = 'Aardvark (n.) Definition of Aardvark'
re.split(r'\s*\([^)]*\)\s*', text)

r''防止任何意外的反斜杠转义。这不要紧，但安全总比抱歉好。你知道吗

\(和\)匹配文字(和)。你知道吗

[^)]匹配除右括号以外的任何内容。注意：这里没有反斜杠转义。你知道吗

\s*在分隔符的方括号部分之前和之后生成任何空格，这样分割的部分就不会以空格开头。如果需要这些空间，请简化为r'\([^)]*\)'。你知道吗

网友

2楼 · 编辑于 2024-09-27 17:46:59

您需要按一个打开的paren、任意数量的非关闭paren字符和一个关闭paren进行拆分。所以你的正则表达式应该是这样的：

split_by = re.compile(r"""
    \(                   # literal open paren
    [^)]*?               # anything but a close paren, repeated 0+ times (non-greedy)
    \)                   # literal close paren""", re.X)

s = "Aardvark (n.) Definition of Aardvark"
split_by.split(s)  # ["Aardvark ", " Definition of Aardvark"]

如果你也想占据这些空间：

re.split(r"\s*\([^)]*?\)\s*", s)

网友

3楼 · 编辑于 2024-09-27 17:46:59

将正则表达式更改为如下内容：

>>> s = 'Aardvark (n.) Definition of Aardvark'
>>> re.split(r'\s*\(.*?\)\s*', s)
['Aardvark', 'Definition of Aardvark']

'\s*\(.*?\)\s*'基本上是指：匹配所有可能的空格，后跟(和)周围的任何空格，以及之后所有可能的空格。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用以“（）”作为分隔符的re模块拆分字符串？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >