我尝试使用unicodes的基本正则表达式,但我无法让它们处理除传统的A-Z和数字之外的字符串
我所看到的例子来自多种语言,而不是A-Z字母家族的一部分
text = "20किटल"
res = re.sub("^[^\W\d_]+$", lambda ele: " " + ele[0] + " ", text)
Output:
20किटल
第二次尝试:
regexp1 = re.compile('^[^\W\d_]+$', re.IGNORECASE | re.UNICODE)
regexp1.sub("^[^\W\d_]+$", lambda ele: " " + ele[0] + " ", text)
Output:
20किटल
Expected output:
**20 किटल**
如果我正确理解您的要求,您是否可以尝试以下方法:
输出:
使用Pypi regex library
其中
\p{L}
代表任何语言中的任何字母输出:
相关问题 更多 >
编程相关推荐