python中的字符串清理

2024-09-28 20:54:18 发布

您现在位置:Python中文网/ 问答频道 /正文

输入:

 " The Elephant's 4 cats. "

预期产量:

^{pr2}$

代码:

 import re

 temp1 = re.sub('\W+',' ', str).strip()
 output = temp2.lower()

我的输出:

 the elephant s 4 cats

我在大象和s之间还有多余的空间。还有一个问题是我不能删除''uu'(下划线)。我哪里出错了,任何建议都会有帮助。在


Tags: the代码importreoutputlowerstrip产量
1条回答
网友
1楼 · 发布于 2024-09-28 20:54:18

尝试:

temp1 = re.sub(r'[^\w\s_]+', '', str).strip()

基本上,原始的\W+表示“非单词字符”,它匹配空格、引号和句点。所以它用一个“空格”代替了它们……这意味着撇号得到了一个空格。在

通过特别匹配非单词非空格非下划线字符,您可能会得到更好的替换。在

相关问题 更多 >