擅长:python、mysql、java
<p>当您在文本文件中看到类似于ÃН(或者更普遍地说是2个字符,其中第一个字符是Ã),很可能文件是用UTF8正确编写的,而编辑器(或屏幕)无法正确处理UTF8。在</p>
<p>让我们看看<code>æ</code>。它是unicode字符U+E6。当你用utf8编码它时,它给出两个字符<code>b'\xc3\xa6'</code>,当它被解码为拉丁1时,它将输出<code>'æ'</code>。在</p>
<p>你能做什么来确认?使用优秀的<a href="http://www.vim.org/" rel="nofollow">vim</a>编辑器,它了解多种编码和其他utf8,至少当您使用它的图形界面<code>gvim</code>时。在</p>
<p>还有一个一般性的建议:<strong>永远不要</strong>在python源文件中写入非ascii字符,除非您将<code># -*- coding: ... -*-</code>行作为第一行(如果第一行是hashbang行,则是第二行)</p>
<p>如果您想在Windows下使用unicode和Python,那么一定要使用本机处理它的IDLE。在</p>
<p>TL/DR:如果您使用的是Linux,很可能您的系统本机配置为使用utf8编码,并且您可以正确地用utf8编写文本文件,但是您的文本编辑器无法正确显示utf8</p>