python/scrapy动态内容

from scrapy.http import FormRequest url = 'https://www.donedeal.ie/search/api/v3/find/' payload = {'section': "cars", 'adType': "forsale", 'source': "", 'sort': "relevance desc", 'area': '', 'max': '30', 'start':'0'} req = FormRequest(url, formdata=payload) fetch(req)

2条回答

网友

1楼 · 编辑于 2024-10-05 13:15:50

问题在于呼叫，有效载荷几乎正常。在

您要清理的站点只接受JSON作为有效负载，因此您应该将FormRequest更改为如下所示：

import json
yield Request( url, method='POST', 
               body=json.dumps(payload), 
               headers={'Content-Type':'application/json'} )

这是因为FormRequest用于模拟HTML表单（内容类型设置为application/x-www-form-urlencoded），而不是JSON调用。在

网友

2楼 · 编辑于 2024-10-05 13:15:50

我不能用Scrapy创建一个有效的例子。在

不过，我确实为你想出了另外两个解决方案。在

在下面的示例中，response包含JSON数据。在

工作示例1使用^{}使用Python2.7.10测试

import urllib2

url = 'https://www.donedeal.ie/search/api/v3/find/'
payload = '{"section":"cars","adType":"forsale","source":"","sort":"relevance desc","max":30,"start":0,"area":[]}'

req = urllib2.Request(url)
req.add_header('Content-Type', 'application/json')

response = urllib2.urlopen(req, payload).read()

工作示例2使用^{}对Python2.7.10和3.3.5和3.5.0

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章