如何使用正则表达式（Python）提取荷兰邮政编码

1条回答

网友

1楼 · 发布于 2024-10-02 16:21:15

您尝试的模式/^(?:NL-)?(\d{4})\s*([A-Z]{2})$/i具有Javascript符号

前导和尾随的/是模式分隔符，^和$是断言字符串开头和结尾的锚点，/i标志用于不区分大小写的匹配

在Python中，要获得问题中的匹配，可以在单词边界\b之间匹配4位数字和2个大写字符A-Z，以防止部分匹配，而不是使用锚，因为匹配不是唯一的字符串

不区分大小写的匹配可以使用re.IGNORECASE

使用re.search也可以返回None，因此首先检查re.search是否有值，然后使用.group()获取匹配项

import re

test = '4706TR Amsterdam'
match =  re.search(r"\b\d{4}[A-Z]{2}\b", test, re.IGNORECASE)
if match:
    print(match.group())

输出

4706TR

如果要匹配可选的NL-部分，模式可以是：

\b(?:NL-)?\d{4}[A-Z]{2}\b