正则表达式分组：如何通过更具体的匹配模式获得所需的输出？问题的回答

正则表达式分组：如何通过更具体的匹配模式获得所需的输出？

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

以下输入条目列表 <pre class="lang-py prettyprint-override"><code>l = ["555-8396 Neu, Allison", "Burns, C. Montgomery", "555-5299 Putz, Lionel", "555-7334 Simpson, Homer Jay"] </code></pre> 预计将转变为： <pre><code>Allison Neu 555-8396 C. Montgomery Burns Lionel Putz 555-5299 Homer Jay Simpson 555-7334 </code></pre> 我尝试了以下方法： <pre class="lang-py prettyprint-override"><code>for i in l: mo = re.search(r"([0-9]{3}-[0-9]{4})?\s*(\w*),\s*(\S.*$)", i) if mo: print("{} {} {}".format(mo.group(3), mo.group(2), mo.group(1))) </code></pre> 并导致以下错误输出（请注意输出的第二行中的“无”） <pre><code>Allison Neu 555-8396 C. Montgomery Burns None Lionel Putz 555-5299 Homer Jay Simpson 555-7334 </code></pre> 但是<a href="https://www.python-course.eu/python3_re.php" rel="nofollow noreferrer">e-book</a>中提到的以下解决方案确实提供了所需的输出： <pre class="lang-py prettyprint-override"><code>for i in l: mo = re.search(r"([0-9-]*)\s*([A-Za-z]+),\s+(.*)", i) print(mo.group(3) + " " + mo.group(2) + " " + mo.group(1)) </code></pre> 简而言之，它归结为2个reg exp搜索的groups（）输出的差异： <pre class="lang-py prettyprint-override"><code>>>> mo = re.search(r"([0-9]{3}-[0-9]{4})?\s*(\w*),\s*(\S.*$)", "Burns, C. Montgomery") >>> mo.groups() (None, 'Burns', 'C. Montgomery') </code></pre> 与 <pre class="lang-py prettyprint-override"><code>>>> mo = re.search(r"([0-9-]*)\s*(\w*),\s*(\S.*$)", "Burns, C. Montgomery") >>> mo.groups() ('', 'Burns', 'C. Montgomery') </code></pre> 无对“” 我想用[0-9]{3}-[0-9]{4}来更精确地匹配电话号码格式，而不是使用[0-9-]*来匹配任意数字和-组合（例如：“0-1-2”或“1-23”）。你知道吗 为什么“*”会导致与“？”不同的分组。是的，在打印结果时处理“无”对我来说是微不足道的，但是我很想知道分组结果差异的原因。你知道吗

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

正则表达式分组：如何通过更具体的匹配模式获得所需的输出？

1 个回答

相关Python问题