擅长:python、mysql、java
<blockquote>
<p>In Python 2, Unicode strings may contain both unicode and bytes:</p>
</blockquote>
<p>不,他们可能不会。它们包含Unicode字符。</p>
<p>在原始字符串中,<code>\xd0</code>不是UTF-8编码的一部分。它是带有代码点208的Unicode字符。<code>u'\xd0'</code>==<code>u'\u00d0'</code>。恰好Python 2中Unicode字符串的<code>repr</code>更喜欢用<code>\x</code>转义来表示字符(即代码点<;256)。</p>
<p>无法查看字符串并指出<code>\xd0</code>字节应该是某个UTF-8编码字符的一部分,或者它实际上代表该Unicode字符本身。</p>
<p>但是,如果假设您始终可以将这些值解释为已编码的值,则可以尝试编写一些内容,依次分析每个字符(使用<code>ord</code>转换为代码点整数),将字符<;256解码为UTF-8,并按原样传递字符>;=256。</p>