我在python中有一个字符串。我用escape()去掉换行符,现在我的字符串如下所示:
<p>Wie hoch ist der Anteil &laquo;oraler MS-Medikamente&raquo;
bei Neuverschreibungen in Ihrer Sprechstunde?&nbsp;</p>
但它应该是这样的
Wie hoch ist der Anteil oraler MS-Medikamente bei Neuverschreibungen in Ihrer Sprechstunde?
我能做什么?你知道吗
您可以unescape字符串,以便取回HTML标记:
然后使用一些正则表达式删除HTML标记:
我并不推荐使用regex来解析HTML,您可以使用
BeautifulSoup
。你知道吗尝试解码(反向转义)。
HTML编码器/解码器-将字符转换为相应的HTML实体-Web 2.0生成器http://goo.gl/2tcml1
您也可以使用此提示
在字符列表中列出所有不必要的符号,然后替换它们:
结果如下:
相关问题 更多 >
编程相关推荐