无法从某些json内容中提取不同深度的所有可用URL问题的回答

无法从某些json内容中提取不同深度的所有可用URL

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我试图解析一些json内容中不同深度的URL的所有值。我附上<a href="https://filebin.net/00t7ezbz7uspwj13" rel="nofollow noreferrer">a file</a>包含不同深度的URL供您考虑 这就是它们的结构（截断）： <pre><code>{'hasSub': True, 'navigationTitle': 'Products', 'nodeName': 'products', 'pages': [{'hasSub': True, 'navigationTitle': 'Enclosures', 'nodeName': 'PG0002SCHRANK1', 'pages': [{'hasSub': True, 'navigationTitle': 'Hygienic Design', 'nodeName': 'PG0125SCHRANK1', 'pages': [{'hasSub': False, 'navigationTitle': 'Hygienic Design Terminal ' 'box HD', 'nodeName': 'PRO0130', 'target': '_self', 'url': '/com-en/products/PG0002SCHRANK1/PG0125SCHRANK1/PRO0130'}, {'hasSub': False, 'navigationTitle': 'Hygienic Design Compact ' 'enclosure HD, ' 'single-door', 'nodeName': 'PRO0131', 'target': '_self', 'url': '/com-en/products/PG0002SCHRANK1/PG0125SCHRANK1/PRO0131'}, </code></pre> 如果我考虑上面的内容，我的输出是： <pre><code>/com-en/products/PG0002SCHRANK1/PG0125SCHRANK1/PRO0130 /com-en/products/PG0002SCHRANK1/PG0125SCHRANK1/PRO0131 </code></pre> 我编写的用于生成json内容的脚本： <pre><code>import requests from pprint import pprint url = 'https://www.rittal.com/.rest/nav/menu/tree?' params = { 'path': 'com', 'locale': 'en', 'deep': '10' } with requests.Session() as s: s.headers['User-Agent'] = 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36' s.headers['Accept'] = 'application/json, text/plain, */*' r = s.get(url,params=params) pprint(r.json()['pages'][0]) </code></pre> <blockquote> How can I scrape all the urls from different depth out of the json content? </blockquote>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

无法从某些json内容中提取不同深度的所有可用URL

1 个回答

相关Python问题