擅长:python、mysql、java
<p>如果<code>webpage</code>声明了编码<code>iso-8859-1</code>,你就不能做<code>webpage.decode("iso-8859-1")</code>?在</p>
<p>此时,<code>webpage</code>将为您的应用程序解码。当它被写入数据库时,那里的映射应该处理char-to-utf8编码。在</p>
<p>为了得到正确的编码,要么告诉web服务器你只接受UTF-8,然后你就会(希望)得到这样的结果,因为几乎每个人都会读UTF-8(或者你可以用ISO-8859-1来尝试);要么使用.info检查返回流的编码名称。在</p>
<p>有关详细信息,请参见<a href="http://www.voidspace.org.uk/python/articles/urllib2.shtml" rel="nofollow noreferrer">urllib2 - The Missing Manual</a>和<a href="http://www.cs.tut.fi/~jkorpela/http.html" rel="nofollow noreferrer">Quick reference to HTTP headers</a>。在</p>