擅长:python、mysql、java
<p>获取html内容后,可以初始化选择器对象以使用xpath选择器:</p>
<pre><code>from scrapy.selector import Selector
import json
response_json = json.loads(response.body_as_unicode())
html = response_json['content_html']
sel = Selector(text=html)
for url in sel.xpath('//@href').extract():
yield Request(url, callback=self.somecallbackfunction)
</code></pre>