这是我的代码,我试图从这个网站访问一个评论,但显示了一个错误。在
class DomainCrawlSpider(BaseSpider):
name = "Spider"
allowed_domains = ["www.smahavarkar.wordpress.com"]
start_urls = "http://smahavarkar.wordpress.com/"
def parse(self, response):
hxs = HtmlXPathSelector(response)
titles = hxs.select("//p")
items = []
for titles in titles:
item = DItem()
item ["address"] = titles.select("a/text()").extract()
item ["review1"] = titles.select("p/text()").extract()
item.append(item)
return item
将
start_urls
更改为:它对我有用。在
start_urls
应该是一个列表,请尝试更改为:相关问题 更多 >
编程相关推荐