擅长:python、mysql、java
<p>使用lxml的Cleaner函数从html内容中删除标记。
下面是一个做你想做的事情的例子。对于HTML文档,Cleaner是比使用strip_元素更好的解决问题的通用方法,因为在这种情况下,您不仅要去掉标记,还需要去掉其他标记上的onclick=function()属性。</p>
<pre><code>import lxml
from lxml.html.clean import Cleaner
cleaner = Cleaner()
cleaner.remove_tags = ['p']
remove_tags:
</code></pre>
<p>要删除的标记列表。只有标签将被删除,它们的内容将被拉到父标签中。</p>