擅长:python、mysql、java
<p>尝试使用<code>\u</code>-转义版本的<code>»</code>:</p>
<pre><code>>>> print(u'\u00bb')
»
</code></pre>
<p>就像在您的<code>.xpath()</code>调用中一样(<strong>注意字符串参数的<code>u"..."</code>前缀</strong>):</p>
^{pr2}$
<p>spider.py文件可能正在使用UTF-8:</p>
<pre><code>>>> u'\u00bb'.encode('utf-8')
'\xc2\xbb'
</code></pre>
<p>因此,您也可以使用<code>hxs.select(u"//a[text()='»']/@href").extract()</code>(前缀仍然存在),但是您还需要告诉Python您的<code>.py</code>编码是什么。在</p>
<p>通常在.py文件的顶部使用<code># -*- coding: utf-8 -*-</code>(或等效文件)(例如第一行)。在</p>
<p>您可以阅读更多关于Python源代码编码声明<a href="https://stackoverflow.com/questions/728891/correct-way-to-define-python-source-code-encoding">here</a>和<a href="https://docs.python.org/2/reference/lexical_analysis.html#encoding-declarations" rel="nofollow noreferrer">here</a>。在</p>