擅长:python、mysql、java
<p>unicode字符串<code>u'\xe8\xb7\xb3\xe8'</code>等效于<code>u'\u00e8\u00b7\u00b3\u00e8'</code>。您需要的是<code>u'\u8df3'</code>,它可以在utf8中编码为<code>'\xe8\xb7\xb3'</code>。在</p>
<p>在Python中,unicode是一个UCS-2字符串(构建选项)。因此,<code>u'\xe8\xb7\xb3\xe8'</code>是一个由4个16位Unicode字符组成的字符串。在</p>
<p>如果你先把它转换成一个字符串(168bUTF字符串):</p>
<pre><code>>>> ''.join([chr(ord(a)) for a in u'\xe8\xb7\xb3']).decode('utf8')
u'\u8df3'
</code></pre>
<p>注意,<code>'\xe8\xb7\xb3\xe8'</code>不是有效的utf8字符串,因为最后一个字节<code>'\xe8'</code>是两字节序列的第一个字符,不能终止utf8字符串。在</p>