在python中使用多个regex提取特定文本？

3条回答

网友

1楼 · 编辑于 2024-09-26 17:55:44

实际上，您需要使用积极的前瞻性断言。在

>>> s = '''Header A
text text
text text
Header B
text text
text text
Header C
text text
here is the end'''
>>> re.findall(r'Header.*?(?=Header)|Header.*?end',s, re.DOTALL)
['Header A\ntext text\ntext text\n', 'Header B\ntext text\ntext text\n', 'Header C\ntext text\nhere is the end']

在正向展望中包含\n，这样就不会在每个项目的最后一个字符中得到\n字符。在

^{pr2}$

或

根据字符串Header前面的新行拆分输入。在

>>> re.split(r'\n(?=Header\b)', s)
['Header A\ntext text\ntext text', 'Header B\ntext text\ntext text', 'Header C\ntext text\nhere is the end']

网友

2楼 · 编辑于 2024-09-26 17:55:44

Header [^\n]*[\s\S]*?(?=Header|$)

试试看这个。看到了吗演示。在

https://regex101.com/r/iS6jF6/21

^{pr2}$

网友

3楼 · 编辑于 2024-09-26 17:55:44

怎么样：

re.findall(r'(?=(Header.*?)(?=Header|end))',data, re.DOTALL)

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python中使用多个regex提取特定文本？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >