使用regex添加空组

2条回答

网友

1楼 · 编辑于 2024-09-29 22:22:15

最简单的方法来执行你所说的“正确证明”匹配，即优先匹配后面的可选子表达式，是反转可选组件的“贪婪”。在Python regex中，这是通过向每个量化元素添加?来实现的：

(\w+ *\w* *\w*) (\d*?\.*?\d*?) *?(\d*?\.*?\d*?) *?(\d*?\.*?\d*?)\n

请注意，您的表达式非常自由，不会验证某些格式不正确的输入。如果这对您有效，那太好了，否则您可能需要考虑将某些部分粘贴到可选组中，例如(| \d+(?:\.\d+)?)来延迟地匹配一个空格和数字（例如，(|x)相当于((?:x)??)）。在

编辑：正如Tim所指出的，这个正则表达式的缺点不仅仅是允许性，而且如果输入的格式稍有错误，可能会引发灾难性的回溯。如果你打算坚持这种方法，我推荐一些更精确的方法：

^{pr2}$

它仍然可以匹配格式错误的输入，但至少现在有点紧了。在

网友

2楼 · 编辑于 2024-09-29 22:22:15

您的正则表达式有几个问题，其中之一是catastrophic backtracking的高风险，因为正则表达式引擎需要在不匹配的情况下测试的置换数量呈指数级增长。另一个问题是\w也将匹配数字，因此第一个组可能包含您不希望它包含的数字。在

此外，对于这样一个“动态增长”的regex，您需要一个“match continuation”特性，比如\G或{}锚点，但是Python不支持这些特性。在

最好的方法是.split()将字符串转换成子字符串，然后检查每个子字符串是否包含数字（例如，trying将其转换为float），并相应地执行相应的操作。在

额外的好处是：您有一个可读的Python脚本，而不是一个非常复杂的regex。在