如何在解析网页时删除所有的智能引号?

2024-09-28 22:50:17 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我的代码:

name = namestr.decode("utf-8")

name.replace(u"\u2018", "").replace(u"\u2019", "").replace(u"\u201c","").replace(u"\u201d", "")

这似乎行不通。我仍然在我的文本中找到&ldquo&rdquo等。同样,这篇文章已经用美丽的汤进行了解析


Tags: 代码name文本replaceutfdecode篇文章namestr
1条回答
网友
1楼 · 发布于 2024-09-28 22:50:17

将代码的最后一行替换为以下代码:

name = name.replace(u"\u2018", "").replace(u"\u2019", "").replace(u"\u201c","").replace(u"\u201d", "")

replace方法返回一个修改过的字符串,但它不会影响调用它的sting,因此您必须像上面一样将返回值赋给变量。在

相关问题 更多 >