非科学字符的Regexp

3条回答

网友

1楼 · 编辑于 2024-09-29 19:30:17

您正在将非字母数字字符（[^A-Za-z0-9 ]）替换为空白（""）。非ASCII字符不在A-Z、A-Z或0-9之间，因此它们被替换。在

您可以像这样匹配所有单词字符：

>>> t = "Meu cão é #paraplégico$."
>>> re.sub("[^\w ]","",t, flags=re.UNICODE)
>>> 'Meu cão é paraplégico'

或者您可以将这些字符添加到正则表达式中，如下所示：[^A-Za-z0-9ãé ]。在

网友

2楼 · 编辑于 2024-09-29 19:30:17

[In 1]: import regex
[In 2]: t = u"Meu cão é #paraplégico$."
[In 3]: regex.sub(r"[^\p{Alpha} ]","",t,flags=regex.UNICODE)
[In 4]: print(regex.sub(r"[^\p{Alpha} ]","",t,flags=regex.UNICODE))

Meu cão é paraplégico

网友

3楼 · 编辑于 2024-09-29 19:30:17

我通过切换到regex库（从PyPI）解决了这个问题。在

然后regex命令变成：

regex.sub(ur"[^\p{L}\p{N} ]+", u"", t)

编程相关推荐

java如何设置apache camel groovy脚本组件的属性
java理解如何在if语句条件内创建对象
java使用访问者和复合模式构建过滤流
游戏框架上的java生成管理区（CRUD）
是java中的toString（）方法。util。日期与地区无关？
java是否可以扩展AppIUMFieldCorator类以使其接受自定义注释？
内存管理java jvm最大和最小堆选项
JavaSpringMVC：正确的异常处理
java保存拖放图像按钮的位置
java如何使用replaceAll（）替换算术（即0+1）

相关问题更多 >

编程相关推荐

热门问题

热门文章

非科学字符的Regexp

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >