对正则表达式组求反

python 2.7 import re bigstr = "jobno: 4859305 jobtype: ASSEMBLY name: BLUEBALLOON color: red jobno: 3995433 name: SNEAKYPETE jobtype: PKG texture: crunchy" regexJobA = re.compile(r'((\w+):\s(\w+)\s?)', re.DOTALL) for mo in regexJobA.finditer( bigstr): keyy, valu = mo.groups(): print keyy + ":" + valu

2条回答

网友

1楼 · 编辑于 2024-06-01 09:32:30

你可以用

regexJobB = re.compile(r'jobno:\s*(\d+)\s*(.*?)(?=\s+jobno:|$)', re.DOTALL)

参见regex demo。它将允许您获得单独的jobno，将它们的id捕获到组1中，并将其余的参数捕获到组2中。然后，您可以使用第二个regex来获取这些参数，或者只使用spliting。你知道吗

见Python demo：

import re
bigstr = "jobno: 4859305 jobtype: ASSEMBLY name: BLUEBALLOON color: red jobno: 3995433 name: SNEAKYPETE jobtype: PKG texture: crunchy"

regexJobB = re.compile(r'jobno:\s*(\d+)\s*(.*?)(?=\s+jobno:|$)', re.DOTALL)
for job in regexJobB.finditer(bigstr):
  jobno = job.group(1)
  jobparams = dict(re.findall(r'(\w+):\s*(\w+)', job.group(2)))
  print("No.: {}\nOther params: {}".format(jobno, jobparams))

输出：

No.: 4859305
Other params: {'color': 'red', 'name': 'BLUEBALLOON', 'jobtype': 'ASSEMBLY'}
No.: 3995433
Other params: {'texture': 'crunchy', 'name': 'SNEAKYPETE', 'jobtype': 'PKG'}

正则表达式匹配

jobno:-文本字符串
\s*-0+空格
(\d+)-第1组：一个或多个数字
\s*-0+空格
(.*?)-第2组：任何0个或更多字符，尽可能少
(?=\s+jobno:|$)-直到前1+个空格，后跟jobno:或字符串结尾。你知道吗

网友

2楼 · 编辑于 2024-06-01 09:32:30

在这里使用re.findall似乎比您目前拥有的有所改进：

bigstr = "jobno: 4859305 jobtype: ASSEMBLY name: BLUEBALLOON color: red jobno: 3995433 name: SNEAKYPETE jobtype: PKG texture: crunchy"
result = re.findall('\S+\s*:\s*\S+', bigstr)
print(result)

['jobno: 4859305', 'jobtype: ASSEMBLY', 'name: BLUEBALLOON', 'color: red', 'jobno: 3995433',
    'name: SNEAKYPETE', 'jobtype: PKG', 'texture: crunchy']

至少这样可以避免迭代。我的答案假设您有一个单行输入字符串。如果您需要跨行匹配，那么我的答案将略有变化。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章