擅长:python、mysql、java
<p>在<code>XpathSelectorList</code>上调用<code>.extract()</code>。它将返回包含所需HTML内容的unicode字符串列表。</p>
<pre><code>hxs.select('//div[@id="leexample"]/*').extract()
</code></pre>
<h2>更新</h2>
<pre><code># This is wrong
hxs.select('//div[@id="leexample"]/html()').extract()
</code></pre>
<p><code>/html()</code>不是有效的scrapy选择器。要提取所有子项,请使用<code>'//div[@id="leexample"]/*'</code>或<code>'//div[@id="leexample"]/node()'</code>。注意,<code>node()</code>将返回<code>textNode</code>,结果类似于:</p>
<pre>
[u'\n ',
u'&lta href="image1.html">Name: My image 1 <br/>'
]
</pre>