在Python中展平嵌套的JSON层次结构

3条回答

网友

1楼 · 编辑于 2024-06-30 16:47:11

一个json递归树可以有多个根，叶不应该强制指定void children。例如，这里有一棵树，它有两个根“a”和“b”，节点只有一个“level”数据，即节点深度（“children”是可选的）：

json_struct = [
    {
    'level': 'a0',
    'children': [{'level': 'a0.1',  'children':
                    [{'level': 'a0.1.1', 'children': []}]},
                 {'level': 'a0.2',  'children': [
                     {'level': 'a0.2.1', 'children': [
                            {'level': 'a0.2.1.1'},
                            {'level': 'a0.2.1.2'},
                            {'level': 'a0.2.1.3'},
                            {'level': 'a0.2.1.4', 'children': [{'level': 'a0.2.1.4.1'}, {'level': 'a0.2.1.4.2'}]}
                            ]
                        }
                    ]
                  },
                 {'level': 'a0.3', 'children': []},
                 {'level': 'a0.4', 'children': [{'level': 'a0.4.1'}, {'level': 'a0.4.2', 'children': []}]}
                ]
    },
    {
        'level': 'b0',
        'children': [{'level': 'b0.1', 'children': [{'level': 'b0.1.1'}]},
                     {'level': 'b0.2', 'children': [{'level': 'b0.2.1', 'children': [
                         {'level': 'b0.2.1.1'},
                         {'level': 'b0.2.1.2'},
                         {'level': 'b0.2.1.3', 'children': [{'level': 'b0.2.1.3.1'}, {'level': 'b0.2.1.3.2'}]},
                         {'level': 'b0.2.1.4'}
                            ]
                        }]},
                     {'level': 'b0.3'}
                     ]
    }
]

代码必须返回叶和完整的分支路径，直到每次离开：

^{pr2}$

它显示：

叶：a0.1.1路径：a0->；a0.1->；a0.1.1
叶：a0.2.1.1路径：a0->；a0.2->；a0.2.1->；a0.2.1.1
叶：a0.2.1.2路径：a0->；a0.2->；a0.2.1->；a0.2.1.2
叶：a0.2.1.3路径：a0->；a0.2->；a0.2.1->；a0.2.1.3
叶：a0.2.1.4.1路径：a0->；a0.2->；a0.2.1->；a0.2.1.4->；a0.2.1.4.1
叶：a0.2.1.4.2路径：a0->；a0.2->；a0.2.1->；a0.2.1.4->；a0.2.1.4.2
叶：a0.3路径：a0->；a0.3
叶：a0.4.1路径：a0->；a0.4->；a0.4.1
叶：a0.4.2路径：a0->；a0.4->；a0.4.2
叶：b0.1.1路径：b0->；b0.1->；b0.1.1
叶：b0.2.1.1路径：b0->；b0.2->；b0.2.1->；b0.2.1.1
叶：b0.2.1.2路径：b0->；b0.2->；b0.2.1->；b0.2.1.2
叶：b0.2.1.3.1路径：b0->；b0.2->；b0.2.1->；b0.2.1.3->；b0.2.1.3.1
叶：b0.2.1.3.2路径：b0->；b0.2->；b0.2.1->；b0.2.1.3->；b0.2.1.3.2
叶：b0.2.1.4路径：b0->；b0.2->；b0.2.1->；b0.2.1.4
叶：b0.3路径：b0->；b0.3

网友

2楼 · 编辑于 2024-06-30 16:47:11

可以使用堆栈处理嵌套结构：

从最外层的列表开始，reversed作为堆栈，每个列表都有一个空元组，以跟踪组织路径。在
在while stack:循环中，从堆栈中获取顶层元素。做你需要做的事情，比如记录名字。从添加了当前组织名称的组织路径中生成一行。在
将Children键中的所有元素与父组织的组织路径一起添加到堆栈中。在
循环直到堆栈完成。在

需要反转，因为从堆栈中获取元素的顺序是相反的。您仍然希望将堆栈用于此作业（而不是队列），因为我们希望首先输出信息深度。在

这看起来像这样：

def flatten_orgs(orgs):
    stack = [(o, ()) for o in reversed(orgs)]  # organisation plus path
    while stack:
        org, path = stack.pop()  # top element
        path += (org['Name'],)   # update path, adding the current name
        yield path               # give this path to the caller
        # add all children to the stack, with the current path
        stack += ((o, path) for o in reversed(org['Children']))

然后可以循环上述函数以获取所有路径：

^{pr2}$

网友

3楼 · 编辑于 2024-06-30 16:47:11

可以递归地对数据进行迭代。Prefix表示到目前为止看到的名称列表，data表示您还必须学习的词法列表。在

data = [{
    "Id": "f035de7f",
    "Name": "Org1",
    "ParentId": None,
    "Children": [{
        "Id": "8c18a70d",
        "Name": "Org2",
        "ParentId": "f035de7f",
        "Children": []
    }, {
        "Id": "b4514099",
        "Name": "Org3",
        "ParentId": "f035de7f",
        "Children": [{
            "Id": "8abe58d1",
            "Name": "Org4",
            "Children": []
        }],
    }, {
        "Id": "8e35bdc3",
        "Name": "Org5",
        "ParentId": "f035de7f",
        "Children": [{
            "Id": "331fffbf",
            "Name": "Org6",
            "ParentId": "8e35bdc3",
            "Children": [{
                "Id": "3bc3e085",
                "Name": "Org7",
                "ParentId": "331fffbf",
                "Children": []
            }],
        }],
    }],
}]



def flatten(data, prefix):
    if not data:
        return [prefix]

    result = []
    for org in data:
        name = org["Name"]
        result.extend(flatten(org["Children"], prefix + [name]))
    return result

print(flatten(data, []))
# [['Org1', 'Org2'], ['Org1', 'Org3', 'Org4'], ['Org1', 'Org5', 'Org6', 'Org7']]

同样，使用产量：

^{pr2}$

如果需要所有部分列表，则解决方案更短：

def flatten(data, prefix):
    yield prefix

    for org in data:
        name = org["Name"]
        yield from flatten(org["Children"], prefix + [name])

print(list(flatten(data, [])))
# [[], ['Org1'], ['Org1', 'Org2'], ['Org1', 'Org3'], ['Org1', 'Org3', 'Org4'], ['Org1', 'Org5'], ['Org1', 'Org5', 'Org6'], ['Org1', 'Org5', 'Org6', 'Org7']]

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中展平嵌套的JSON层次结构

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >