基于其他键值对填充空白字典值

import pandas as pd import json import numpy as np from pandas.io.json import json_normalize df = pd.read_json('data/world_bank_projects.json') print(df['mjtheme_namecode'].head(15)) 0 [{'code': '8', 'name': 'Human development'}, {... 1 [{'code': '1', 'name': 'Economic management'},... 2 [{'code': '5', 'name': 'Trade and integration'... 3 [{'code': '7', 'name': 'Social dev/gender/incl... 4 [{'code': '5', 'name': 'Trade and integration'... 5 [{'code': '6', 'name': 'Social protection and ... 6 [{'code': '2', 'name': 'Public sector governan... 7 [{'code': '11', 'name': 'Environment and natur... 8 [{'code': '10', 'name': 'Rural development'}, ... 9 [{'code': '2', 'name': 'Public sector governan... 10 [{'code': '10', 'name': 'Rural development'}, ... 11 [{'code': '10', 'name': 'Rural development'}, ... 12 [{'code': '4', 'name': ''}] 13 [{'code': '5', 'name': 'Trade and integration'... 14 [{'code': '6', 'name': 'Social protection and ... Name: mjtheme_namecode, dtype: object

1条回答

网友

1楼 · 发布于 2024-09-28 03:22:11

您可以采用类似的方法创建新的数据帧，但随后会转换回：

theme= pd.DataFrame([val for pair in df['mjtheme_namecode'].values for val in pair])
mapper = theme.drop_duplicates().replace(r'', np.nan).dropna().set_index('code').name.to_dict()

使用列表理解将所有内容放在一起：

s = pd.Series(
    [[{'code': i['code'], 'name': mapper[i['code']]}
        for i in t] for t in df.mjtheme_namecode]
)

s.head(13)

0     [{'code': '8', 'name': 'Human development'}, {...
1     [{'code': '1', 'name': 'Economic management'},...
2     [{'code': '5', 'name': 'Trade and integration'...
3     [{'code': '7', 'name': 'Social dev/gender/incl...
4     [{'code': '5', 'name': 'Trade and integration'...
5     [{'code': '6', 'name': 'Social protection and ...
6     [{'code': '2', 'name': 'Public sector governan...
7     [{'code': '11', 'name': 'Environment and natur...
8     [{'code': '10', 'name': 'Rural development'}, ...
9     [{'code': '2', 'name': 'Public sector governan...
10    [{'code': '10', 'name': 'Rural development'}, ...
11    [{'code': '10', 'name': 'Rural development'}, ...
12    [{'code': '4', 'name': 'Financial and private ...
dtype: object

如您所见，最后一行（第12行）已正确填写，其他行也已正确填写，您可以将其重新分配给原始数据帧。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章