Scrapy:POST请求返回JSON响应（200ok），但d不完整

yield FormRequest(url,headers=header,formdata={'entity_id': '70431','profile_action': 'review-top','page':str(p), 'limit': '5'},callback=self.parse_review) header = {#'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:44.0) Gecko/20100101 Firefox/44.0', 'X-Requested-With': 'XMLHttpRequest', 'Host': 'www.zomato.com', 'Accept': '*/*', 'Referer': 'https://www.zomato.com', 'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8', 'dont_filter':'True' } url = 'https://www.zomato.com/php/social_load_more.php'

{'Accept-Language': ['en'], 'Accept-Encoding': ['gzip, deflate,br'], 'Dont_Filter': ['True'], 'Connection': ['keep-alive'], 'Accept': ['*/*'], 'User-Agent': ['Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:44.0) Gecko/20100101 Firefox/44.0'], 'Host': ['www.zomato.com'], 'X-Requested-With': ['XMLHttpRequest'], 'Cookie': ['zl=en; fbtrack=9be27330646d24088c56c2531ea2fbf5; fbcity=7; PHPSESSID=2338004ce3fd540477242c3eaee685168163bd05'], 'Referer': ['https://www.zomato.com'], 'Content-Type': ['application/x-www-form-urlencoded; charset=UTF-8']})

1条回答

网友

1楼 · 发布于 2024-10-02 02:32:11

由于不使用cookies，您将无法获得响应的html内容。在您提到的实际请求头中，有一个cookie属性。但是在通过代码发送的ajax请求中，没有cookie字段。在

首先，在响应zomato餐厅页面的请求时设置一个cookie，url为：https://www.zomato.com/city/restaurant/reviews。现在，当单击loadmore按钮时，将发送一个请求，其中包含服务器在对url“https://www.zomato.com/php/social_load_more.php”的上一个响应中设置的cookie字段。因此，每次发出ajax请求时，在前一个响应中设置的cookie应该发送到请求头中，并且在当前请求的响应中设置一个新的cookie。在

所以，为了管理这些cookies，我使用了requests包的session对象。脚本也可以不使用scrapy编写。当您在scray中编写代码时，请查看是否有任何会话对象可用于管理scrapy的cookies。在

我的代码：

import requests
url : 'https://www.zomato.com/city/restaurant/reviews' 
s = requests.Session()
resp = s.get(url, headers=header)

上面的代码是将请求发送到餐厅评论的url。这很重要，因为第一个cookie是在对该请求的响应中设置的。在

^{pr2}$

现在向社交加载发出请求_更多.php. 对象“s”管理cookies。变量loadreviews现在将具有json格式的html数据。在

相关问题更多 >

编程相关推荐

热门问题

热门文章