在下面的正则表达式中,我希望字符串中的每个字符都替换为“X”,但它不起作用。在
在Python 2.7中:
>>> import re
>>> re.sub(u"[a-zA-Z]","X","dfäg")
'XX\xc3\xa4X'
或者
^{pr2}$在Python 3.4中:
>>> re.sub("[a-zA-Z]","X","dfäg")
'XXäX'
是否可以以某种方式“配置”[a-zA-Z]模式以匹配“ä”、“ü”等。?如果不能做到这一点,我如何在方括号之间创建一个类似的字符范围模式,在通常的“完整字母表”范围内包含Unicode字符?我的意思是,在像德语这样的语言中,ä会被放在字母表中靠近a的地方,所以人们会期望它被包含在a-z范围内。在
你可以用
使用Unicode修饰符。
(?![\d_])
展望限制了\w
速记类,因为它不能匹配任何数字(\d
)或下划线。在见regex demo
一个Python 3 demo:
^{pr2}$至于Python 2:
相关问题 更多 >
编程相关推荐