如何用Json\u normalize展平嵌套Json数据

[ { "a": "A1", "b": "B1", "c": [ { "c1": "C111", "c2": "C121", "c3": ["C1131","C1132"] } ] }, { "a": "A2", "b": "B2", "c": [ { "c1": "C211", "c2": "C212", "c3": ["C2131","C2132"] }, { "c1": "C221", "c2": "C222", "c3": ["C2231"] } ] } ]

a c1(a) c2 c3 0 A1 C111 C121 ["C1131","C1132"] 1 A2 C211 C212 ["C2131","C2132"] 2 A2 C221 C222 ["C2231"]

3条回答

网友

1楼 · 编辑于 2024-09-27 21:34:13

data = [
  {
    "a": "A1",
    "b": "B1",
    "c": [
      {
        "c1": "C111",
        "c2": "C121",
        "c3": ["C1131","C1132"]
      }
    ]
  },
  {
    "a": "A2",
    "b": "B2",
    "c": [
      {
        "c1": "C211",
        "c2": "C212",
        "c3": ["C2131","C2132"]
      },
      {
        "c1": "C221",
        "c2": "C222",
        "c3": ["C2231"]
      }
    ]
  }
]
pd.io.json.json_normalize(data,"c", ['a', 'b',])

输出：

    c1      c2      c3              a   b
0   C111    C121    [C1131, C1132]  A1  B1
1   C211    C212    [C2131, C2132]  A2  B2
2   C221    C222    [C2231]         A2  B2

网友

2楼 · 编辑于 2024-09-27 21:34:13

您可以尝试：

from collections import defaultdict

norm_data = defaultdict(list)
for item in data:
    for element in item['c']:
        norm_data['a'].append(item['a'])
        for k, v in element.items():
            if k in {'a', 'c1'}:
                norm_data['c1(a)'].append(v)
            else:
                norm_data[k].append(v)

pd.DataFrame(norm_data)

网友

3楼 · 编辑于 2024-09-27 21:34:13

如果您已经经历了隐藏真实数据的痛苦，那么让模拟数据也具有与真实数据相同的特性。你知道吗

假设你有这个JSON：

json_data = [
  {
    "a": "A1",
    "b": "B1",
    "c": [
      {
        "a": "C111",
        "c2": "C121",
        "c3": ["C1131","C1132"]
      }
    ]
  },
  {
    "a": "A2",
    "b": "B2",
    "c": [
      {
        "a": "C211",
        "c2": "C212",
        "c3": ["C2131","C2132"]
      },
      {
        "a": "C221",
        "c2": "C222",
        "c3": ["C2231"]
      }
    ]
  }
]

只需一行代码即可提取：

pd.io.json.json_normalize(json_data, 'c', ['a', 'b'], record_prefix='data.')

结果：

  data.a data.c2         data.c3   a   b
0   C111    C121  [C1131, C1132]  A1  B1
1   C211    C212  [C2131, C2132]  A2  B2
2   C221    C222         [C2231]  A2  B2

record_prefix='data.'就是ValueError: Conflicting metadata name a, need distinguishing prefix错误消息的意思。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章