如何按regex模式分割一个sting，并捕获模式内容？

2条回答

网友

1楼 · 编辑于 2024-10-03 06:30:52

试试这个代码！！这也许有用！你知道吗

import re
text = "bla bla 1 bla bla bla 142 bla bla"
replaced = re.sub('([0-9]+)', r'\n\1\n',text)
print(replaced)

Output:  'bla bla \n1\n bla bla bla \n142\n bla bla'

网友

2楼 · 编辑于 2024-10-03 06:30:52

使用

s = re.sub(r' \d+ ', '\n\\g<0>\n', s)

参见regex demo。你知道吗

只替换独立的数字作为整个单词使用

s = re.sub(r'\b\d+\b', '\n\\g<0>\n', s)

如果要匹配用空格括起来的数字，请仅使用

re.sub(r'(?<!\S)\d+(?!\S)', '\n\\g<0>\n', s) # also at the start/end of string
re.sub(r'(?<=\s)\d+(?=\s)', '\n\\g<0>\n', s) # only between whitespaces

实际上，替换可以指定为'\n\g<0>\n'，因为\g是一个未定义的转义序列，在这种情况下反斜杠将被视为文字字符，并将保留在结果字符串中以形成regex backreference构造。你知道吗

Python demo：

import re
s = "bla bla 1 bla bla bla 142 bla bla"
s = re.sub(r'\b\d+\b', '\n\\g<0>\n', s)
print(s) # => bla bla \n1\n bla bla bla \n142\n bla bla

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何按regex模式分割一个sting，并捕获模式内容？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >