正则表达式,大括号的含义

2024-06-01 06:05:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在编写一些python代码,它使用“re”python包在给定的项列表中搜索具有正则表达式模式的项。在

当我查看代码时,我遇到了一些我无法理解的正则表达式大括号。在

代码片段是这样的。在

regex = re.search("mov .* ptr \[(?P<dst>([(rax)|(rbx)|(rcx)|(rdx)|(rsi)|(rdi)|(r9)|(r10)|(r11)|(r12)|(r13)|(r14)|(r15)]{3}))\], (?P<src>([(rax)|(rbx)|(rcx)|(rdx)|(rsi)|(rdi)|(r9)|(r10)|(r11)|(r12)|(r13)|(r14)|(r15)]{3}))$", f)

f是一个给定的输入,看起来像这样。在

regex变为1,我打印了f的内容,显示如下。在

“移动qword ptr[rsi],rdi”

我不能理解的是正则表达式中的大括号,在本例中是“{3}”。 据我所知,只有一个数字“n”的大括号用来表示前面的表达式需要精确地出现“n”次才能匹配(在我的例子中是三次)。 (例如,ab{3}将导致abbb匹配)

所以,如果这是正确的,我认为“(rax),(rbx),(rcx)等…”中的一个需要正好出现三次才能匹配,但是对于上面显示的f的内容,情况并非如此。在

所以我想知道我遗漏了什么,以及如何理解上面正则表达式中的大括号。在


Tags: 代码re大括号regexraxrsiptrr11
3条回答

其他人的回答是正确的,我只是向您展示一种可视化/测试正则表达式模式的方法。在

Regular expression visualization

Debuggex Demo

这里有一个伪正则表达式。它并不像写它的人想做的那样。在

为了证明这一点,我输入了一个无效的输入:

$ python2
...
>>> s = ("mov .* ptr \[(?P<dst>([(rax)|(rbx)|(rcx)|(rdx)|"
... "(rsi)|(rdi)|(r9)|(r10)|(r11)|(r12)|(r13)|(r14)|"
... "(r15)]{3}))\], (?P<src>([(rax)|(rbx)|(rcx)|(rdx)|"
... "(rsi)|(rdi)|(r9)|(r10)|(r11)|(r12)|(r13)|(r14)|(r15)]{3}))$")
>>> import re
>>> r2 = re.search(s, "mov qword ptr [r5i], rdi")
>>> r2
<_sre.SRE_Match object at 0x800684ca8>
>>> r2.group('dst')
'r5i'
>>> r2 = re.search(s, "mov qword ptr [(5i], rdi")
>>> r2.group('dst')
'(5i'
>>>

很难说是谁写了这个表达式,以及他们是如何想出最终使用什么的。但是,您是正确的,{3}的意思是“正好重复三次”。在

提供的正则表达式使用方括号不正确。括号表示一组字符,因此这些字符后面的{3}表示其中三个字符的任何组合都将匹配。您可以在[]下查看文档here。在

我相信正确的正则表达式应该是:

regex = re.search(
    'mov .* ptr '
    '\[(?P<dst>(rax|rbx|rcx|rdx|rsi|rdi|r9|r10|r11|r12|r13|r14|r15))\], '
    '(?P<src>(rax|rbx|rcx|rdx|rsi|rdi|r9|r10|r11|r12|r13|r14|r15))$', f)

相关问题 更多 >