2024-10-01 07:25:03 发布
网友
Scrapy有可能抓取警报信息吗?在
例如,链接,http://domainhere/admin一旦加载到实际浏览器中,就会出现一条带有表单的警告消息来填充用户名和密码。在
或者,有没有一种方法可以检查警报消息中的表单,从而知道要填写哪些参数?在
PS:我确实有这个网站的证书,我只想通过网络爬网自动化进程。在
谢谢。在
为了实现这一目标,我做了以下工作:
代码:
import scrapy class TestScraper(scrapy.Spider): handle_httpstatus_list = [401] name = "Test" allowed_domains = ["xxx.xx.xx"] start_urls = ["http://testdomain/test"] auth = "Basic [Key Here]" def parse(self, response): return scrapy.Request( "http://testdomain/test", headers={'Authorization': self.auth}, callback=self.after_login ) def after_login(self, response): self.log(response.body)
现在,您可以在身份验证过程后对页面进行爬网。在
为了实现这一目标,我做了以下工作:
代码:
现在,您可以在身份验证过程后对页面进行爬网。在
相关问题 更多 >
编程相关推荐