数据帧中的双嵌套JSON

[{'A': 's1', 'B': 'sent1', 'sb': [{'C': 158, 'D': 1, 'E': 'ent1', 'F': 'yes'}, {'C': 158, 'D': 1, 'E': 'ent2', 'F': 'no'}]}, {'A': 's1', 'B': 'sent6', 'sb': [{'C': 260, 'D': 5, 'E': 'ent1', 'F': 'no'}]}]

[{'A': 's1', 'B': 'sent1', 'sb': [{'C': 158, 'D': 1, 'tok': [{'E': 'ent1', 'F': 'yes'}]]}, {'C': 158, 'D': 1, 'tok': [{'E': 'ent2', 'F': 'no'}]}]}, {'A': 's1', 'B': 'sent6', 'sb': [{'C': 260, 'D': 5, 'tok': [{'E': 'ent1', 'F': 'no'}]}]}]

1条回答

网友

1楼 · 发布于 2024-09-18 18:45:40

我认为您需要在解决方案之前创建由dict列表填充的tok列，然后将E,F列更改为tok：

x['tok'] = x[['E','F']].apply(lambda x: [dict(x)], axis=1)
y = x.groupby(['A','B'])[['C','D','tok']].apply(lambda x: x.to_dict(orient='r')).reset_index(name='sb').to_dict(orient='r')
print (y)

[{
    'A': 's1',
    'B': 'sent1',
    'sb': [{
        'C': 0,
        'D': 0,
        'tok': [{
            'E': 'e1',
            'F': 'yes'
        }]
    }, {
        'C': 0,
        'D': 0,
        'tok': [{
            'E': 'e2',
            'F': 'no'
        }]
    }]
}, {
    'A': 's4',
    'B': 'sent6',
    'sb': [{
        'C': 74,
        'D': 6,
        'tok': [{
            'E': 'e1',
            'F': 'no'
        }]
    }]
}]

相关问题更多 >

编程相关推荐

热门问题

热门文章