我在一个效率低下的mann中使用Python正则表达式

def stripMatchedQuotes(item): MatchedSingleQuotes = re.compile(r"'(.*)'", re.LOCALE) MatchedDoubleQuotes = re.compile(r'"(.*)"', re.LOCALE) item = MatchedSingleQuotes.sub(r'\1', item, 1) item = MatchedDoubleQuotes.sub(r'\1', item, 1) return item def processVariables(item): VariableDefinition = re.compile(r'<%(.*?)=(.*?)%>', re.LOCALE) VariableUse = re.compile(r'<%(.*?)%>', re.LOCALE) Variables={} while VariableDefinition.search(item): VarName, VarDef = VariableDefinition.search(item).groups() VarName = stripMatchedQuotes(VarName).upper().strip() VarDef = stripMatchedQuotes(VarDef.strip()) Variables[VarName] = VarDef item = VariableDefinition.sub('', item, 1) while VariableUse.search(item): VarName = stripMatchedQuotes(VariableUse.search(item).group(1).upper()).strip() item = VariableUse.sub(Variables[VarName], item, 1) return item

3条回答

网友

1楼 · 编辑于 2024-10-01 07:41:43

永远不要创建自己的编程语言。永远。（我以前对这个规则有一个例外，但现在不是了。）

总有一种现有的语言可以更好地满足你的需要。如果你详细描述了你的用例，人们可能会帮助你选择一种合适的语言。在

网友

2楼 · 编辑于 2024-10-01 07:41:43

第一件可以改善的事情是重新编译功能之外。编译被缓存，但在检查它是否已编译时会出现速度问题。在

另一种可能是使用单个regex，如下所示：

MatchedQuotes = re.compile(r"(['\"])(.*)\1", re.LOCALE)
item = MatchedQuotes.sub(r'\2', item, 1)

最后，您可以在processVariables中将其组合到regex中。接受Torsten Marek's建议为使用函数re.sub公司，这大大改善和简化了事情。在

^{pr2}$

以下是我10万次跑步的时间安排：

Original       : 13.637
Global regexes : 12.771
Single regex   :  9.095
Final version  :  1.846

[编辑]添加缺少的非贪婪说明符

[Edit2]Added.upper（）调用与原始版本一样不区分大小写

网友

3楼 · 编辑于 2024-10-01 07:41:43

^{}可以将callable作为参数，而不是简单的字符串。使用它，您可以用一个函数调用替换所有变量：

>>> import re
>>> var_matcher = re.compile(r'<%(.*?)%>', re.LOCALE)
>>> string = '<%"TITLE"%> <%"SHMITLE"%>'
>>> values = {'"TITLE"': "I am a title.", '"SHMITLE"': "And I am a shmitle."}
>>> var_matcher.sub(lambda m: vars[m.group(1)], string)
'I am a title. And I am a shmitle.

跟随eduffy.myopenid.com网站的建议，并保留已编译的正则表达式。在

同样的方法也可以应用于第一个循环，只是在那里你需要先存储变量的值，并始终返回""作为替换。在

相关问题更多 >

编程相关推荐

热门问题

热门文章