python正则表达式(检索)无法检测错误

import csv import re clean = [] error = [] pid_pattern = '[A-Z]{3}[0-9]{4}[A-Z]{2}[0-9]' dept_pattern = '[A-Z]{3}' arr_pattern = '[A-Z]{3}' with open(r"test.csv") as csvfile: reader = csvfile for i in reader: pid = re.search(pid_pattern,i) dept = re.search(dept_pattern,i) arr = re.search(arr_pattern,i) if pid !=None and dept != None and arr != None: clean.append(i) elif pid == None: error.append(i) elif dept == None: error.append(i) elif arr == None: error.append(i)

1条回答

网友

1楼 · 发布于 2024-10-01 00:36:07

问题是正则表达式总是在找到第一个匹配时触发。由于csv读取器返回的行的格式类似于“PID，DEPT，ARR”，这意味着如果PID中有格式[A-Z]{3}，它将找到一个匹配项。为了防止出现这种情况，可以将列分开并搜索与列对应的每个部分上的正则表达式（我不知道如何做），或者更改正则表达式。你知道吗

import csv
import re

clean = []
error = []

pid_pattern = '[A-Z]{3}[0-9]{4}[A-Z]{2}[0-9],.+,.+' // only look at the first column
dept_pattern = '.+,[A-Z]{3},.+' // only look at second column
arr_pattern = '.+,.+[A-Z]{3}' // only look at third column

with open(r"test.csv") as csvfile:
    reader = csvfile
    for i in reader:
        pid = re.search(pid_pattern,i)
        dept = re.search(dept_pattern,i)
        arr = re.search(arr_pattern,i)

        if pid !=None and dept != None and arr != None:
             clean.append(i)
        elif passenger_id == None:
            error.append(i)
        elif departure == None:
            error.append(i)
        elif arrival == None:
            error.append(i)

或者您可以将整个regex表达式组合成一个[A-Z]{3}[0-9]{4}[A-Z]{2}[0-9],[A-Z]{3},[A-Z]{3}

用于使用匹配和组捕获的regex ([A-Z]{3}[0-9]{4}[A-Z]{2}[0-9]),([A-Z]{3}),([A-Z]{3})

相关问题更多 >

编程相关推荐

热门问题

热门文章