具有多行和d的非reedy行为

file_header foo lorem ipsum \pope 24 dolor sit amet, consectetur adipisici elit Excepteur sint obcaecat cupiditat non gnu blu bar=1 foo lorem ipsum \ @>@!@ consectetur adipisici elit gnu blu bar=2 foo lorem ipsum 23 dolor sit amet, consectetur adipisici elit gnu blu bar=3 foo ... etc

3条回答

网友

1楼 · 编辑于 2024-06-26 14:46:59

贪婪是从左到右的

它与MULTILINE或DOTALL无关，它是非贪婪算子只影响比赛的结束，不影响比赛的开始。在

要满足您的需求，请在您的模式前面添加.*。在

>>> re.findall(r'.*(foo.*?bar=1)', s, re.DOTALL)
['foo lorem ipsum \\pope\n24 dolor sit amet, consectetur adipisici elit\nExcepteur sint obcaecat cupiditat non \ngnu blu bar=1']
>>> re.findall(r'.*(foo.*?bar=2)', s, re.DOTALL)
['foo lorem ipsum @>@!@ consectetur adipisici elit\ngnu blu bar=2']
>>> re.findall(r'.*(foo.*?bar=3)', s, re.DOTALL)
['foo lorem ipsum\n23 dolor sit amet, consectetur adipisici elit\ngnu blu bar=3']

网友

2楼 · 编辑于 2024-06-26 14:46:59

你可以使用像

^foo(?:(?!^foo|bar=2$).)*bar=2$

(?:(?!^foo|bar=2$).)*匹配不是foo（在一行/字符串的开头）并且不是{}在行/字符串结尾的任何文本。在

参见regex demo。但是，这样的构造是消耗资源的，建议展开它。这里有一个选项：

^{pr2}$

见another demo。在

网友

3楼 · 编辑于 2024-06-26 14:46:59

此程序查找foo <stuff> bar=<number>的所有非重叠出现。请注意，在re.MULTILINE-模式下成功地使用了非贪心运算符：^foo.*?bar=\d+$

import re
from pprint import pprint

data = '''
file_header

foo lorem ipsum \pope
24 dolor sit amet, consectetur adipisici elit
Excepteur sint obcaecat cupiditat non 
gnu blu bar=1

foo lorem ipsum \
@>@!@ consectetur adipisici elit
gnu blu bar=2
foo lorem ipsum
23 dolor sit amet, consectetur adipisici elit
gnu blu bar=3
'''

matches = re.findall(r'^foo.*?bar=\d+$', data, re.DOTALL|re.MULTILINE)
pprint (matches)

结果：

^{pr2}$

贪婪是从左到右的

相关问题更多 >

编程相关推荐

热门问题

热门文章