斯皮蒂：哪只蜘蛛不知道呢问题的回答

斯皮蒂：哪只蜘蛛不知道呢

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我想废弃这个网站：<a href="http://www.meetic.fr/" rel="nofollow noreferrer">Meetic.fr</a>，法语版本meetic.com网站. 在 我们的目标是知道经过认证后，有多少人被连接（显示在页面顶部）。在 这是蜘蛛：（[kobeddl，stack123456]是真正的登录，如果你想尝试一些东西） <pre><code>from scrapy.spider import BaseSpider from scrapy.selector import HtmlXPathSelector from scrapy.http import FormRequest, Request from meetic.items import MeeticItem class MeeticSpider(BaseSpider): name = "meetic" allowed_domains = ["meetic.fr"] start_urls = ["http://www.meetic.fr/"] def parse(self, response): print 'TEST1' return [FormRequest.from_response(response, formdata={'log': 'kobeddl', 'pwd': 'stack123456'}, callback=self.after_login)] def after_login(self, response): # check login succeed before going on if "authentication failed" in response.body: self.log("Login failed", level=log.ERROR) print 'TEST2' return # We've successfully authenticated, let's have some fun! else: print 'TEST3' return Request(url="http://www.meetic.fr/scheduler.php?url=", callback=self.parse_tastypage) def parse_tastypage(self, response): hxs = HtmlXPathSelector(response) item = MeeticItem() item['nb'] = hxs.select('/html/body/div/div/div/div/div/div/ul/li[2]/a/div/span').extract() print 'TEST4' return item </code></pre> 以下是命令提示符下的结果：<img src="https://i.imgur.com/E3JnR.jpg" alt="result"/> 编辑：如您所见，只有第一个print语句<code>TEST1</code>正在工作。我刚接触python和scrapy，所以原因可能很愚蠢。在 我想我的蜘蛛有个错误，这里：<code>if "authentication failed" in response.body:</code> 我在另一只蜘蛛身上发现了这一点，但我不知道如何调整它来适应这只蜘蛛。在 我还更改了设置文件中的用户代理 <code>USER_AGENT = 'Mozilla/5.0 (X11; Linux x86_64; rv:7.0.1) Gecko/20100101 Firefox/7.7'</code> 提前谢谢

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

斯皮蒂：哪只蜘蛛不知道呢

1 个回答

相关Python问题