擅长:python、mysql、java
<p>那些不是<code>unicode-escape</code>的-顾名思义,它处理像<code>\u00e9</code>但不是<code>\xe9</code>这样的Unicode序列</p>
<p>你得到的是UTF-8编码序列。解码的方法是将其转换成<code>bytes</code>序列,然后将其解码为Unicode字符串</p>
<pre><code># Let's not shadow the string library
s = "\xc3\xa9comiam"
print(bytes(s, 'latin-1').decode('utf-8'))
</code></pre>
<p><code>'latin-1'</code>技巧是一个肮脏的秘密,它只是将每个字节转换为具有相同字符代码的字符</p>
<p>对于您的文件,您可以以二进制模式打开它,这样您就不必显式地将它转换为<code>bytes</code>,或者您可以简单地对读取的字符串应用相同的转换</p>