正则表达式中的嵌套文本

import re text = 'message msgName { stuff { innerStuff } more stuff } \n message mn2 { junk }' messagePattern = re.compile('message (.*?) {(.*)}', re.DOTALL) messageList = messagePattern.findall(text) print "messages:\n" count = 0 for message, msgDef in messageList: count = count + 1 print str(count) print message print msgDef

import re text = 'message msgName { stuff { innerStuff } more stuff } \n message mn2 { junk }' messagePattern = re.compile('message (.*?) {(.*?)}', re.DOTALL) messageList = messagePattern.findall(text) print "messages:\n" count = 0 for message, msgDef in messageList: count = count + 1 print str(count) print message print msgDef

1条回答

网友

1楼 · 发布于 2024-10-02 22:32:31

如果可以使用PyPi ^{} module，则可以利用其子例程调用支持：

>>> import regex
>>> reg = regex.compile(r"(\w+)\s*({(?>[^{}]++|(?2))*})")
>>> s = "message msgName { stuff { innerStuff } } \n message mn2 { junk }"
>>> print(reg.findall(s))
[('msgName', '{ stuff { innerStuff } }'), ('mn2', '{ junk }')]

正则表达式^{}匹配：

(\w+)-1组匹配1个或多个字母数字/下划线字符
\s*-0+空格
({(?>[^{}]++|(?2))*})-第2组匹配一个{，然后是非{}或另一个由于(?2)子例程调用而平衡的{...}（递归整个第2组子模式），0次或更多次，然后匹配一个结束的}。你知道吗

如果只有一个嵌套级别，re也可以与

(\w+)\s*{[^{}]*(?:{[^{}]*}[^{}]*)*}

看这个regex demo

(\w+)-第1组匹配单词字符
\s*-0+空格
{-大括号
[^{}]*-0+除{和}以外的字符
(?:{[^{}]*}[^{}]*)*-0+序列：
- {-大括号
- [^{}]*-0+除{和}以外的字符
- }-右大括号
- [^{}]*-0+除{和}以外的字符
}-右大括号

相关问题更多 >

编程相关推荐

热门问题

热门文章