正则表达式街道地址模式

1条回答

网友

1楼 · 发布于 2024-10-01 15:33:55

`re`模块的解决方案

由于Python不支持简单语法来匹配Unicode字母类别中的任何字符，因此我们必须列出包含我们希望允许的字符的范围。在

\b\d{1,3}(?:\s[a-zA-Z\u00C0-\u017F]+)+

样本运行：

^{2}$

^{} module的解决方案

但是，上述解决方案不能扩展到不同语言的字符。如果您不介意安装外部的^{}模块，那么您可以使用\p{L}来匹配来自任何语言的任何字母。在

\b[0-9]{1,3}(?:\s\p{L}+)+

[0-9]{1,3}匹配一位、两位或三位数字。\s\p{L}+匹配空格和一个或多个字母。同样地，非捕获组之后的(?:\s\p{L}+)++将在非捕获组内重复该模式一次或多次。在

Demo

要使用它，您需要导入regex模块，而不是re模块。在

>>> reg = regex.compile(r'\b[0-9]{1,3}(?:\s\p{L}+)+')
>>> reg.search("xxx 35 rue Hote de ma maison, 060 06 ").group(0)
'35 rue Hote de ma maison'
>>> reg.search('"xxx 34 rue Roveré').group(0)
'34 rue Roveré'

`re`模块的解决方案

^{} module的解决方案

相关问题更多 >

编程相关推荐

热门问题

热门文章

正则表达式街道地址模式

re模块的解决方案

^{} module的解决方案

相关问题 更多 >

编程相关推荐

热门问题

热门文章

`re`模块的解决方案

相关问题更多 >