擅长:python、mysql、java
<p>正如问题的注释中所述,您的代码有一些问题。在</p>
<p>首先,您不需要两个方法,因为在<code>parse</code>方法中,您调用了与在<code>start_urls</code>中相同的URL。在</p>
<p>若要从站点获取一些信息,请尝试使用以下代码:</p>
<pre><code>def parse(self, response):
for tr in response.xpath('//div[@class="section group"][5]/div[@class="col span_2_of_2"][1]/table//tr'):
if tr.xpath(".//td[@class='i']"):
name = tr.xpath('./td[1]/a/text()').extract()[0]
location = tr.xpath('./td[2]//text()').extract()[0]
print name, location
</code></pre>
<p>并根据你的需要调整它来填充你的物品。在</p>
<p>如您所见,您的浏览器在<code>table</code>中显示了一个额外的<code>tbody</code>,当您使用Scrapy进行刮取时,它不存在。这意味着您经常需要判断您在浏览器中看到的内容。在</p>