我想在一个长字符串中找出一些特殊的关键字。 以下是示例:
long_str = '''
TX[03]
rqn : 0x73
cqn : 0x12
packets : 888
encap : 0
csumNone : 0
csumOk : 0
lroPackets : 0
lroBytes : 0
wqeErr : 0
RX[12]
rqn : 0xa6
cqn : 0x2a
packets : 123
encap : 0
csumNone : 0
csumOk : 0
lroPackets : 0
lroBytes : 0
wqeErr : 0
RX[13]
rqn : 0xa9
cqn : 0x2c
packets : 456
encap : 0
csumNone : 0
csumOk : 0
lroPackets : 0
lroBytes : 0
wqeErr : 0'''
result = re.findall('RX\[\d+\].*packets\s+:\s+(\d+)', a, re.DOTALL)
但是result
是{['123','456']
不一样。在
如何修复重新模式以筛选出预期值?在
提前谢谢。在
最简单的解决方案是让它变懒:
请看working on regex101.com。
否则,您的
.*
构造会占用整个字符串并在之后回溯(即找到最后一个packets
时成功)。会是另一个: ^{pr2}$
请参见this one working here(注意不同的修改器!)。在
如文档https://docs.python.org/2/library/re.html中所述,}限定符都是贪婪的;它们尽可能多地匹配文本。有时这种行为并不理想;如果RE
'*'
、'+'
和{<.*>
与<a> b <c>
匹配,它将匹配整个字符串,而不仅仅是<a>
。在限定符后添加?
使其以非贪婪或最小的方式执行匹配;将匹配尽可能少的字符。使用RE<.*?>
将只匹配<a>
。在类似地,在您的例子中,
result = re.findall('RX\[\d+\].*?packets\s+:\s+(\d+)', a, re.DOTALL)
将给出预期的结果。在相关问题 更多 >
编程相关推荐