擅长:python、mysql、java
<p>我刚找到两个解决办法。你能确认一下吗?在</p>
<pre><code>Soup = BeautifulSoup(r.content.decode('utf-8','ignore'),"lxml")
</code></pre>
<p>以及</p>
^{pr2}$
<p>这两个结果都会产生以下示例输出:</p>
<pre><code>Der Wildlöwenpfleger
</code></pre>
<p><strong>编辑:</strong>
我只是想知道为什么这些工作,因为<code>r.encoding</code>结果是{<cd2>}。这说明请求无论如何都将数据处理为<code>UTF-8</code>数据。因此,我想知道为什么<code>.decode('utf-8','ignore')</code>或{<cd5>}会产生所需的输出?在</p>
<p><strong>编辑2:</strong>
好吧,我想我现在明白了。<code>.decode('utf-8','ignore')</code>和<code>fromEncoding='utf-8'</code>意味着实际数据被编码为<code>UTF-8</code>,而beautifulGroup应该对其进行解析,并将其处理为<code>UTF-8</code>编码的数据,实际上就是这样。在</p>
<p>我假设<code>requests</code>正确地将其处理为<code>UTF-8</code>,但{<cd12>}没有。因此,我必须做这个额外的解码。在</p>