擅长:python、mysql、java
<p>U+FFFD是执行<code>some_bytes.decode('some-encoding', 'replace')</code>操作时得到的替换字符,并且<code>some_bytes</code>的某些子字符串无法解码。</p>
<p>你有两个:<code>u'H\ufffd\ufffdftsitz'</code>。。。这表示u-umlaut被表示为两个字节,每个字节都无法解码。最有可能的是,这个站点是用UTF-8编码的,但是软件试图将其解码为ASCII。尝试解码为ASCII通常发生在意外转换为Unicode时,ASCII用作默认编码。然而,在这种情况下,人们不会期望使用<code>'replace'</code>arg。更可能的是,代码接受了一种编码,并且是由一个认为“不引发异常”的人编写的,意思与“工作”相同。</p>
<p>编辑问题以提供URL,并显示生成<code>u'H\ufffd\ufffdftsitz'</code>的<em>最小</em>代码。</p>