擅长:python、mysql、java
<p><em>如果<code>decode</code>作为UTF-8不起作用,则每个Unicode序数都可以用UTF-8表示,这是因为正在传输的字节采用不同的编码,或者数据是文本和二进制数据的混合,并且只有一部分是UTF-8。很可能是文本<em>是</em>UTF-8编码的(大多数网络协议都是),因此非UTF-8数据将是帧数据或类似数据,需要进行解析以提取文本数据。</p>
<p>任何试图在文本/二进制情况下掩盖此类错误的尝试都将只是消除问题,而不是修复它们。您需要知道数据的编码(以及格式,如果不是所有的文本数据都有一个编码),然后使用它。你收到的数据不会神奇地变成UTF-16或UTF-32,因为你想要它。</p>