使用pyjq解析多个json值，用comm分隔

import json import csv import pyjq emp_data = open('example.json', 'r') emp_data_parsed = json.loads(emp_data.read()) emp = pyjq.all ('.base[].base[].uid, .base[].base[].name', emp_data_parsed) print emp

example.json { "base": [ { "base": [ { "item-number": 1, "type": "access-item", "uid": "2da21174-0af8-4b5b-b02e-2957a24d70e1", "usage": { "last-date": { "iso-8601": "2018-03-19T03:58-0500", }, }, "item-number": 2, "name": "Tommy", "type": "access-item", "uid": "fcc5a2c8-3a78-4cc5-9fd3-e7bd59eb36ba", "item-number": 3, "name": "Sam", "type": "access-item", "uid": "4ecf6450-7307-466c-bf19-663ba2fbaf69", "usage": { "last-date": { "iso-8601": "2018-03-21T07:21-0500", }, }, } ], } ], }

2条回答

网友

1楼 · 编辑于 2024-05-19 13:32:37

有趣的是，我知道^{}，Python包装器是个好主意。在

我使用jq进行数据处理。还有grep，head等：）当我需要使用CSV时，我宁愿将CSV写入JSONL（反之亦然）程序一次，然后将其用作shell管道中的另一个工具。在

# to_csv.py
import csv, json, sys
rows = [json.loads(line) for line in sys.stdin]
all_keys = []
for row in rows:
    for key in row.keys():
        if key not in all_keys:
            all_keys.append(key)
writer = csv.DictWriter(sys.stdout, fieldnames=all_keys, extrasaction='ignore')
writer.writeheader()
for row in rows:
    writer.writerow(row)

用法（我不得不稍微修改一下example.json）：

^{pr2}$

网友

2楼 · 编辑于 2024-05-19 13:32:37

Question: I need to format the output bit more so this can be exported to csv.

无法使用pyjp进行测试，从Project description猜测，请尝试：

pyjq.all('.base[].base[] | {"uid": .uid, "item-number":.item-number}', emp_data_parsed)

将JSON循环如下：

^{pr2}$

Output:

{'uid': '2da21174-0af8-4b5b-b02e-2957a24d70e1', 'item-number': 1}, ... (omitted for brevity)
{'uid': 'fcc5a2c8-3a78-4cc5-9fd3-e7bd59eb36ba', 'item-number': 2}, ... (omitted for brevity)
{'uid': '4ecf6450-7307-466c-bf19-663ba2fbaf69', 'item-number': 3}, ... (omitted for brevity)

输出已准备就绪，csv.DictWriter读取csv.DictWriter，例如：

import csv

with open('test.csv', 'w') as csv_file:
    fieldnames = ['uid', 'item-number']
    writer = csv.DictWriter(csv_file, fieldnames=fieldnames, extrasaction='ignore')
    writer.writeheader()

    for record in emp_data_parsed['base'][0]['base']:
        writer.writerow(record)

Output:

uid,name
2da21174-0af8-4b5b-b02e-2957a24d70e1,None
fcc5a2c8-3a78-4cc5-9fd3-e7bd59eb36ba,Tommy
4ecf6450-7307-466c-bf19-663ba2fbaf69,Sam

相关问题更多 >

编程相关推荐

热门问题

热门文章