在爬行时从废壳获取空响应印度怪兽网

2条回答

网友

1楼 · 编辑于 2024-09-30 22:14:02

您要查找的数据不在主页上，而是在页面加载后检索到的响应中。如果您在浏览器中选中“viewpagesource”，您将看到第一个请求中实际出现的内容。在

通过检查devtools中的network选项卡，您将看到更多的请求，比如对这个URL的请求：https://www.monsterindia.com/middleware/jobsearch?query=computer&sort=1&limit=25

网友

2楼 · 编辑于 2024-09-30 22:14:02

因此，Thiago想得到的是页面更新时使用了xhr请求，其中包括一个results count查询字符串参数。这将返回您可以解析的json。因此，您将url更改为该值并相应地处理json。在

利用请求来演示

import requests
from bs4 import BeautifulSoup as bs
import json

r = requests.get('https://www.monsterindia.com/middleware/jobsearch?query=computer&sort=1&limit=100')
soup = bs(r.content, 'lxml')
data = json.loads(soup.select_one('p').text)['jobSearchResponse']['data']

for item in data:
    print(item)

第一项的JSON

https://jsoneditoronline.org/?id=fe49c53efe10423a8d49f9b5bdf4eb36

用刮痧：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

在爬行时从废壳获取空响应印度怪兽网

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >