python正则表达式将行开头的已定义单词与其他lin中定义的单词之间的所有内容进行匹配

##Rulebase-definition rulebase bb action priority 6 dynamic-only ruledef rd-6 charging-action throttle monitoring-key 1 action priority 7 dynamic-only ruledef rd-7 charging-action p2p_Drop action priority 139 dynamic-only ruledef rd-8 charging-action p2p_Drop monitoring-key 1 #exit

RDFile = open('RB-definitions.txt') txt2 = RDFile.read() ruledef_list = [] for match2 in re.findall((?<=ruledef)((?:.|\n)*?)(?=charging-action), txt2): print match2 +"\n" ruledef_list.append(match2)

start_tag = '^ruledef ' #additional space char content = '((?:.|\n)*?)' end_tag = '#exit' for RD_name in ruledef_list: print RD_name for match in re.findall(start_tag + RD_name + content + end_tag, txt): print match + end_tag + "\n"

1条回答

网友

1楼 · 发布于 2024-05-18 06:54:04

缺少多行模式。否则，^只匹配整个字符串的开头。另外，您可以通过使用singleline/dotall模式来避免(?:.|\n)（它使.匹配任何字符）：

start_tag = r'^ruledef ' #additional space char
content = r'(.*?)'                                
end_tag = r'#exit'

...

for match in re.findall(start_tag + RD_name + content + end_tag, txt, re.M|re.S):
    ...

请注意，这将给出ruledef的内容（即，只有content部分匹配的内容-不ruledef，没有名称，没有#exit). If this is not what you want, simply remove the parentheses in内容`：

^{pr2}$

顺便说一句，使用否定的前瞻性而不是不整洁的量词可能更有效（但是，如果速度是您的重要关注点，则不必—请对此进行概述）：

^{3}$

最后，请注意我是如何对所有regex模式使用原始字符串的。这是Python中的一个很好的实践，否则您可能会遇到复杂转义模式的问题（例如，您必须对某些东西进行双重转义）。在

相关问题更多 >

编程相关推荐

热门问题

热门文章