我目前正在编写一些python代码,它使用“re”python包在给定的项列表中搜索具有正则表达式模式的项。在
当我查看代码时,我遇到了一些我无法理解的正则表达式大括号。在
代码片段是这样的。在
regex = re.search("mov .* ptr \[(?P<dst>([(rax)|(rbx)|(rcx)|(rdx)|(rsi)|(rdi)|(r9)|(r10)|(r11)|(r12)|(r13)|(r14)|(r15)]{3}))\], (?P<src>([(rax)|(rbx)|(rcx)|(rdx)|(rsi)|(rdi)|(r9)|(r10)|(r11)|(r12)|(r13)|(r14)|(r15)]{3}))$", f)
f是一个给定的输入,看起来像这样。在
regex变为1,我打印了f的内容,显示如下。在
“移动qword ptr[rsi],rdi”
我不能理解的是正则表达式中的大括号,在本例中是“{3}”。 据我所知,只有一个数字“n”的大括号用来表示前面的表达式需要精确地出现“n”次才能匹配(在我的例子中是三次)。 (例如,ab{3}将导致abbb匹配)
所以,如果这是正确的,我认为“(rax),(rbx),(rcx)等…”中的一个需要正好出现三次才能匹配,但是对于上面显示的f的内容,情况并非如此。在
所以我想知道我遗漏了什么,以及如何理解上面正则表达式中的大括号。在
其他人的回答是正确的,我只是向您展示一种可视化/测试正则表达式模式的方法。在
Debuggex Demo
这里有一个伪正则表达式。它并不像写它的人想做的那样。在
为了证明这一点,我输入了一个无效的输入:
很难说是谁写了这个表达式,以及他们是如何想出最终使用什么的。但是,您是正确的,
{3}
的意思是“正好重复三次”。在提供的正则表达式使用方括号不正确。括号表示一组字符,因此这些字符后面的
{3}
表示其中三个字符的任何组合都将匹配。您可以在[]
下查看文档here。在我相信正确的正则表达式应该是:
相关问题 更多 >
编程相关推荐