擅长:python、mysql、java
<p>我必须为我的一个项目自动完成这个任务。我找到的解决方案是使用<a href="http://www.crummy.com/software/BeautifulSoup/" rel="nofollow noreferrer" title="BeautifulSoup">Beautiful Soup</a>模块来提取脚本标记(我也为样式和表单这样做)。你知道吗</p>
<pre><code>soup = BeautifulSoup(html_string, convertEntities=BeautifulSoup.HTML_ENTITIES)
scripts = soup.findAll('script') # find and return a list of 'script' entities
for s in scripts:
s.extract() # remove it from the DOM completely
</code></pre>
<p>然后,您可以打印出BeautifulSoup或保存html。你知道吗</p>