如何使用pandas从嵌套JSON数组中提取值问题的回答

如何使用pandas从嵌套JSON数组中提取值

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有一个大的JSON文件（400k行）。我试图孤立以下内容： 策略-“说明” 策略项-“用户”和“数据库值” JSON文件-<a href="https://pastebin.com/hv8mLfgx" rel="nofollow noreferrer">https://pastebin.com/hv8mLfgx</a> 熊猫的预期产量：<a href="https://imgur.com/a/FVcNGsZ" rel="nofollow noreferrer">https://imgur.com/a/FVcNGsZ</a> “Policy Items”之后的所有内容在整个文件中都是完全相同的。我尝试了下面的代码来隔离“用户”。它似乎不起作用，我正在尝试将所有这些都转储到CSV中。在 这里是一个我试图尝试的解决方案，但无法使其正常工作-<a href="https://stackoverflow.com/questions/45168524/deeply-nested-json-response-to-pandas-dataframe?fbclid=IwAR1yv8UAdqFG8Ba5Nouw1f8h33M8QJmASKzXEJUPdIsz6CQVZwyFiIfN_U8">Deeply nested JSON response to pandas dataframe</a> <pre><code>from pandas.io.json import json_normalize as Jnormal import json import pprint, csv import re with open("Ranger_Policies_20190204_195010.json") as file: jsonDF = json.load(file) for item in jsonDF['policies'][0]['policyItems'][0]: print ('{} - {} - {}'.format(jsonDF['users'])) </code></pre> 编辑2：我有一些工作代码，可以抓住一些用户，但它没有抓住所有的用户。25人中只有11人。在 ^{pr2}$ 编辑3:这是最后的工作副本，但是我仍然没有复制我所有的表数据。我设置了一个循环来忽略一切。捕捉所有的东西，我会在Excel中进行排序，有人知道为什么我不能捕捉所有的表值吗？在 <pre><code> json_data = json.load(file) with open("test.csv", 'w', newline='') as fd: wr = csv.writer(fd) wr.writerow(('Database name', 'Users', 'Description', 'Table')) for policy in json_data['policies']: desc = policy['description'] db_values = policy['resources']['database']['values'] db_tables = policy['resources']['table']['values'] for item in policy['policyItems']: users = item['users'] for dbT in db_tables: for user in users: for db in db_values: _ = wr.writerow((db, user, desc, dbT))``` </code></pre>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

如何使用pandas从嵌套JSON数组中提取值

1 个回答

相关Python问题