将带有空列表的嵌套DICT转换为数据帧列

2024-10-03 23:21:22 发布

男 | 程序猿一只，喜欢编程写python代码。

我有一些来自API的数据，我正试图将其转换为数据帧。我努力从嵌套的DICT列表中提取“SudioXYZYXCR”ID号（其中列表可以是中间数据集中的空）。p>

output = {'data': [{'abc_serial_number__c': 'ABC2020-07571',
       'id': 'V48000000000F79',
       'modified_date__v': '2020-06-15T05:13:14.000Z',
       'name__v': 'VVV-001039',
       'station_xyz__cr': {'data': [{'id': 'V5J000000000B86'}],
                           'responseDetails': {'limit': 250,
                                               'offset': 0,
                                               'size': 1,
                                               'total': 1}}},
      {'abc_serial_number__c': 'ABC2020-09952',
       'id': 'V48000000001B94',
       'modified_date__v': '2020-06-24T11:30:40.000Z',
       'name__v': 'VVV-004040',
       'station_xyz__cr': {'data': [],
                           'responseDetails': {'limit': 250,
                                               'offset': 0,
                                               'size': 1,
                                               'total': 1}}},
      {'abc_serial_number__c': 'ABC2020-09196',
       'id': 'V48000000001B95',
       'modified_date__v': '2020-06-23T09:38:18.000Z',
       'name__v': 'VVV-004041',
       'station_xyz__cr': {'data': [{'id': 'V5J000000000Z10'}],
                           'responseDetails': {'limit': 250,
                                               'offset': 0,
                                               'size': 1,
                                               'total': 1}}}],
 'responseDetails': {'limit': 1000, 'offset': 0, 'size': 3, 'total': 3},
 'responseStatus': 'SUCCESS'}

我试图将嵌套的id数据放入dataframe中的列中，如下所示：

   station_xyz__cr.data.id
0          V5J000000000B86
1                     None 
2          V5J000000000Z10

我已经尝试使用json_normalize转换为数据帧（删除我不需要的列）：

df = pd.json_normalize(output['data'])
df = df.loc[:, ~df.columns.str.startswith('station_xyz__cr.responseDetails')]
print(df)

  abc_serial_number__c               id          modified_date__v     name__v  \
0        ABC2020-07571  V48000000000F79  2020-06-15T05:13:14.000Z  VVV-001039   
1        ABC2020-09952  V48000000001B94  2020-06-24T11:30:40.000Z  VVV-004040   
2        ABC2020-09196  V48000000001B95  2020-06-23T09:38:18.000Z  VVV-004041   

          station_xyz__cr.data  
0  [{'id': 'V5J000000000B86'}]  
1                           []  
2  [{'id': 'V5J000000000Z10'}]

但我正在努力将DICT的“station_xyz_uucr.data”列表转换为ids的简单数据帧：

df2 = pd.DataFrame(df['station_xyz__cr.data'].tolist(), index= df.index)
df2 = df2.rename(columns = {0:'station_xyz__cr.data'})
df2

        station_xyz__cr.data
0  {'id': 'V5J000000000B86'}
1                       None
2  {'id': 'V5J000000000Z10'}

当我试图进一步提取时，“无”给我带来了问题。我尝试替换“无”-但只能替换为0:

df.fillna(0, inplace=True)

Tags：数据 id number df data date serial cr

1条回答

网友

1楼 · 发布于 2024-10-03 23:21:22

获取无值的行索引。使用行索引作为掩码，将行、列组合设置为默认值，该值与数据流中下一阶段的其余列值一致

isna_idx = pd.isnull(df2['station_xyz__cr.data'])
df2.loc[isna_idx, ['station_xyz__cr.data']] = {'id': '...'}

将带有空列表的嵌套DICT转换为数据帧列

相关问题更多 >

编程相关推荐

热门问题

热门文章

将带有空列表的嵌套DICT转换为数据帧列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >