用python在波斯语数字和字母之间添加空格

网友
1楼 · 编辑于 2024-07-05 07:44:04

你可以用
re.sub(r'([^\W\d_])(\d)', r'\1 \2', s, flags=re.U)
注意，在python3.x中，re.U标志是多余的，因为默认情况下模式是Unicode感知的。你知道吗
参见online Python demo和regex demo。你知道吗
图案细节
([^\W\d_])-捕获组1：任何Unicode字母（字面上，除了非单词、数字或下划线字符以外的任何字符）
(\d)-捕获组2：任何Unicode数字
替换模式是组1和组2占位符（指相应的捕获值）的组合，它们之间有一个空格。你知道吗
您可以使用带有前瞻性的regex变体：
re.sub(r'[^\W\d_](?=\d)', r'\g<0> ', s)
见this regex demo。你知道吗

网友
2楼 · 编辑于 2024-07-05 07:44:04

我不确定这是不是一个正确的方法。你知道吗
import re k = "سعید123" m = re.search("(\d+)", k) if m: k = " ".join([m.group(), k.replace(m.group(), "")]) print(k)
输出：
123 سعید

网友
3楼 · 编辑于 2024-07-05 07:44:04

有一个短正则表达式，可以用来匹配字母和数字之间的边界（在任何语言中）：

\d(?=[^_\d\W])|[^_\d\W](?=\d)

Live demo

细分：

\d匹配一个数字
(?=[^_\d\W])在一种语言的字母前面
|或
[^_\d\W]匹配一种语言的字母
(?=\d)数字前

Python：

re.sub(r'\d(?![_\d\W])|[^_\d\W](?!\D)', r'\g<0> ', str, flags = re.UNICODE)

但根据this answer，这是完成这项任务的正确方法：

re.sub(r'\d(?=[آابپتثجچحخدذرزژسشصضطظعغفقکگلمنوهی])|[آابپتثجچحخدذرزژسشصضطظعغفقکگلمنوهی](?=\d)', r'\g<0> ', str,  flags = re.UNICODE)

相关问题更多 >

编程相关推荐

热门问题

热门文章