擅长:python、mysql、java
<p><code>č</code>不是由<code>u'\u00c4\u008d'</code>表示的。这两个十六进制值是UTF-8编码的值,因此应该以<code>'\xc4\x8d'</code>的形式在字节字符串中写入。示例:</p>
<pre><code>>>> s = '\xc4\x8d'
>>> s.decode('utf8')
u'\u010d'
>>> print(s.decode('utf8'))
č
</code></pre>
<p>注意:您的终端必须配置支持字符正确打印的编码,否则您将看到<code>UnicodeEncodeError</code>。在</p>
<p>如果出于某种原因,您有一个错误解码的Unicode字符串,那么可以利用Unicode的前256个代码点与<code>latin1</code>编码相关的事实,并修复它:</p>
^{pr2}$
<p>如果您有一个错误解码的Unicode字符串,您应该显示您拥有的文件或读取它的代码,并解决这个问题。在</p>