擅长:python、mysql、java
<p>您似乎对Unicode进行了错误的解码;这些是UTF-8字节屏蔽为拉丁语-1码位。在</p>
<p>您可以通过编码到一个将Unicode码位一对一映射到字节的编解码器(如拉丁语1:</p>
<pre><code>>>> uni_var = u'Na teatr w pi\xc4\x85tek'
>>> uni_var.encode('latin1')
'Na teatr w pi\xc4\x85tek'
</code></pre>
<p>但是要小心,这里也可能是CP1252编码被用来解码为Unicode的。这完全取决于这个<a href="http://en.wikipedia.org/wiki/Mojibake" rel="nofollow">Mojibake</a>是在哪里生产的。在</p>
<p>您还可以使用<a href="https://github.com/LuminosoInsight/python-ftfy" rel="nofollow">^{<cd1>} library</a>来检测如何最好地修复此问题;它会生成Unicode输出:</p>
^{pr2}$
<p>图书馆将自动处理CP1252 Mojibake的。在</p>