用正则表达式（不规则正则表达式键）提取代码

def get_p_number(text): rx = re.compile(r'[p/n:]\s+((?:\w+(?:\s+|$)){1})', re.I) res = [] m = rx.findall(text) if len(m) > 0: m = [p_number.replace(' ', '').upper() for p_number in m] m = remove_duplicates(m) res.append(m) else: res.append('no P Number found') return res

2条回答

网友

1楼 · 编辑于 2024-10-03 00:19:44

简单的模式M?[-\d]+应该适合您。下面是一个演示：

import re

text_list = ['Industry / Gemany / PN M564839', 'Industry / France / PN: 575-439', 'Telecom / Gemany / P/N 26-59-29', 'Mobile / France / P/N: 88864839']

res = []
for elem in text_list:
    for code in re.findall(r'M?[-\d]+', elem):
        res.append(code)

print(res)

Output:

['M564839', '575-439', '26-59-29', '88864839']

网友

2楼 · 编辑于 2024-10-03 00:19:44

在您的模式中，character类[p/n:]\s+将匹配列出的字符之一，后跟1+空格字符。在本例中，匹配正斜杠或冒号后跟空格的数据。你知道吗

下一部分(?:\w+(?:\s+|$))将匹配1+个单词字符，后跟字符串结尾或1+个空格字符，而不考虑中间的空格字符或连字符。你知道吗

一个选项是将PN与可选的:和/匹配，而不是使用字符类[p/n:]，并将您的值包含在捕获组中：

/ P/?N:? ([\w-]+)

Regex demo| Python demo

例如：

import re
text_list = ['Industry / Gemany / PN M564839', 'Industry / France / PN: 575-439', 'Telecom / Gemany / P/N 26-59-29', 'Mobile / France / P/N: 88864839']
regex = r"/ P/?N:? ([\w-]+)"
res = []
for text in text_list: 
    matches = re.search(regex, text)
    if matches:
        res.append(matches.group(1))

print(res)

结果

['M564839', '575-439', '26-59-29', '88864839']

相关问题更多 >

编程相关推荐

热门问题

热门文章