擅长:python、mysql、java
<p>Python确实包含了一些针对这种情况的特殊字符串编解码器。在</p>
<p>在这种情况下,如果32-127范围之外没有其他字符,则可以使用“unicode_escape”编解码器安全地解码字节字符串,以便在Python中有一个正确的unicode文本对象。
(您的程序应该在其上执行所有文本操作)-
每当您再次输出该文本时,您会像往常一样将其转换为utf-8:</p>
<pre><code>rawtext = r"""<a href="http://www.mypage.com/\u0441andmoretext">\u00b2<\a>"""
text = rawtext.decode("unicode_escape")
# Text operations go here
...
output_text = text.encode("utf-8")
</code></pre>
<p>如果32-127范围之外还有其他字节,则unicode_转义编解码器
假设它们是拉丁1编码。因此,如果您的响应混合了utf-8和这些\uxxx序列,您必须:</p>
<ol>
<li>使用utf-8解码原始字符串</li>
<li>编码回拉丁1</li>
<li>使用“unicode_escape”解码</li>
<li>练习课文</li>
<li>编码回utf-8</li>
</ol>