混淆了Python中regex的用法问题的回答

混淆了Python中regex的用法

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

您的惊人结果与正则表达式量词<code>*</code>有关。在 考虑： <pre><code>[a-z]* </code></pre> <img src="https://www.debuggex.com/i/YBDzadvXGTfIDaci.png" alt="Regular expression visualization"/> <a href="https://www.debuggex.com/r/YBDzadvXGTfIDaci" rel="nofollow">Debuggex Demo</a> 对比： ^{pr2}$ <img src="https://www.debuggex.com/i/K2Bukobv3YIH8Kh2.png" alt="Regular expression visualization"/> <a href="https://www.debuggex.com/r/K2Bukobv3YIH8Kh2" rel="nofollow">Debuggex Demo</a> 作为另一个例子，我认为它更能说明你所看到的： <pre><code>>>> re.findall(r'[a-z]*', '123456789') ['', '', '', '', '', '', '', '', '', ''] </code></pre> 字符串<code>123456789</code>中的集合<code>[a-z]</code>中没有字符。然而，由于<code>*</code>的意思是'零或更多'，所有字符位置“匹配”的方式是不匹配该位置的任何字符。在 例如，假设您只想测试字符串中是否有字母，并使用如下正则表达式： <pre><code>>>> re.search(r'[a-z]*', '1234') <_sre.SRE_Match object at 0x1069b6988> # a 'match' is returned, but this is # probably not what was intended </code></pre> <hr/> 现在考虑一下： <pre><code>>>> re.findall(r'[a-z]*', '123abc789') ['', '', '', 'abc', '', '', '', ''] </code></pre> 对比： <pre><code>>>> re.findall(r'([a-z])*', '123abc789') ['', '', '', 'c', '', '', '', ''] </code></pre> 第一个模式是<code>[a-z]*</code>。部分<code>[a-z]</code>是与集合<code>a-z</code>中的一个单个字符匹配的字符类，除非修改；如果大于零，则添加<code>*</code>量词将贪婪地匹配尽可能多的字符——因此匹配“abc”，但也允许零个字符匹配（或者字符集之外的字符匹配位置，因为0是匹配的）。在 在<code>([a-z])*</code>中添加分组有效地将量化集中的匹配减少到单个字符，并返回集合中匹配的最后一个字符。在 如果您想获得分组的效果（比如在更复杂的模式中），请使用非捕获组： <pre><code>>>> re.findall(r'(?:[a-z])*', '123abc789') ['', '', '', 'abc', '', '', '', ''] </code></pre>

混淆了Python中regex的用法

1 个回答

相关Python问题