擅长:python、mysql、java
<p>我建议您使用它来处理这个问题:它将加载的文档简单地转换为utf-8</p>
<pre><code>markup = "<h1>Sacr\xc3\xa9 bleu!</h1>"
soup = BeautifulSoup(markup)
soup.h1
# <h1>Sacré bleu!</h1>
soup.h1.string
# u'Sacr\xe9 bleu!'
</code></pre>
<p>美化组文档:<a href="http://bit.ly/1lX6Qln" rel="nofollow">here</a></p>