擅长:python、mysql、java
<p>通过使用bs4的decompose删除HTML中潜在的危险部分,我已经解决了这样一个问题。例如,对于如下所示的page_html soup:</p>
<p><code><about>Not important, and possibly dangerous!</about>
<stats>This is the important part.</stats></code></p>
<p>我会做一些类似的事情:</p>
<p><code>not_needed = page_html.about
not_needed.decompose()</code></p>
<p>你只剩下<code><stats>This is the important part.</stats></code>。因此,您可以完全删除用户的个人描述,然后安全地提取您需要的任何内容。在</p>