在正则表达式中的字符后开始匹配

1条回答

网友

1楼 · 发布于 2024-05-19 10:28:38

您可以使用Python PyPi regex module和\G锚来获得连续的匹配。\G锚点在上一个匹配结束时的字符串开头匹配

使用2个捕获组获取数据，并使用regex.findall从组返回值

模式

(?:^[^→\r\n]*→|\G(?!^))[^\S\r\n]*(\d+)\.[^\S\r\n]*(.*?)[^\S\r\n]*(?=$|\d\.)

解释

(?:非捕获组
- ^[^→\r\n]*→匹配除换行符或→之外的任何字符的0+次出现次数
- |或
- \G(?!^)在上一个匹配的末尾而不是开始处断言位置
)闭合群
[^\S\r\n]*匹配0+个空格，换行符除外
(\d+)捕获组1，匹配1+个数字
\.?[^\S\r\n]*匹配一个可选点，后跟0+空格，换行符除外
(.*?)捕获组2，匹配任何字符0+次非贪婪
[^\S\r\n]*匹配0+尾随空格
(?=正向前瞻，断言右边的是
- $|\d\.断言字符串的结尾或匹配数字和点
)关闭前瞻

Regex demo in pcre Python demo

代码示例

import regex

pattern = r"(?:^[^→\r\n]*→|\G(?!^))[^\S\r\n]*(\d+)\.[^\S\r\n]*(.*?)[^\S\r\n]*(?=$|\d\.)"

test_str = "Abc def. 2. Ghi jkl. → 1. Mno 2. Pqrs 3. Tu 4 vx 5. yz..."

print(regex.findall(pattern, test_str))

输出

[('1', 'Mno'), ('2', 'Pqrs'), ('3', 'Tu 4 vx'), ('5', 'yz...')]

相关问题更多 >

编程相关推荐

热门问题

热门文章

在正则表达式中的字符后开始匹配

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >