擅长:python、mysql、java
<p>如果您想检查哪个工具/库最适合您执行此任务,可以尝试使用<a href="https://scraperwiki.com/" rel="nofollow">https://scraperwiki.com/</a>-。在</p>
<p>有一个选项可以使用html5lib、pyquery、bs4等(测试简单)</p>
<p>你可以试试beautifulsoup:</p>
<pre><code>BeautifulSoup(html).prettify()
</code></pre>
<p>其中html是您的内容</p>
<p>BS应该擅长处理糟糕的html。。。在</p>