使用AJAX的抓取站点

Request(url='domain/ajaxlst?par1=x&par2=y', callback=self.parse_all) Request(url='domain/ajaxlst?par1=x&par2=y', callback=self.parse_all, headers={all_headers}) Request(url='domain/ajaxlst?par1=x&par2=y', callback=self.parse_all, headers={all_headers}, cookies={all_cookies})

2条回答

网友

1楼 · 编辑于 2024-10-02 20:35:03

由于请求模块不能很好地处理AJAX，您需要的是一个无头浏览器。在

这种无头浏览器之一是selenium。在

即）

driver.find_element_by_id("show more").click() # This is just an example case

网友

2楼 · 编辑于 2024-10-02 20:35:03

通常，当您向下滚动页面时，Ajax将向服务器发送请求，然后服务器将向您的浏览器响应json/xml文件以刷新页面。在

您需要找出链接到此json/xml文件的url。通常，您可以打开firefox浏览器并打开tools/web dev/web控制台。监视网络活动，您可以轻松地捕获这个json/xml文件。在

一旦找到这个文件，就可以直接解析来自它们的评论（我推荐Python模块请求和bs4来完成这项工作），并减少大量的时间。记住使用不同的客户端和IP。对服务器好一点，它不会阻止你。在

相关问题更多 >

编程相关推荐

热门问题

热门文章