如何从数据框中列出字典?

2024-10-03 17:22:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在寻找建立一个具体的字典清单。我希望结构类似于以下内容:

[{'label': 'Abdelnaby, Alaa', 'value': '76001'},
{'label': 'Abdul-Aziz, Zaid', 'value': '76002'},
{'label': 'Abdul-Jabbar, Kareem', 'value': '76003'}]

目前,我从中提取的数据位于一个数据帧中。下面的示例。。。你知道吗

PlayerID    Name     Current Player First Season    Last Season
76001   Abdelnaby, Alaa       0     1990            1994
76002   Abdul-Aziz, Zaid      0     1968            1977
76003   Abdul-Jabbar, Kareem  0     1969            1988
51      Abdul-Rauf, Mahmoud   0     1990            2000
1505    Abdul-Wahad, Tariq    0     1997            2003

请告诉我这是否足够。非常感谢你的帮助!你知道吗


Tags: 数据示例字典value结构labelseasonplayerid
3条回答

选择您的列,重命名它们并用orient='records'调用to_dict以获得dict列表

(df.reindex(['Name', 'PlayerID'], axis=1)
   .set_axis(['label', 'value'], axis=1, inplace=False)
   .to_dict('r'))    

# [{'label': 'Abdelnaby, Alaa', 'value': 76001},
#  {'label': 'Abdul-Aziz, Zaid', 'value': 76002},
#  {'label': 'Abdul-Jabbar, Kareem', 'value': 76003},
#  {'label': 'Abdul-Rauf, Mahmoud', 'value': 51},
#  {'label': 'Abdul-Wahad, Tariq', 'value': 1505}]

您可以通过将.to_dict('r')更改为.to_json(orient='records')来输出JSON。你知道吗


如果性能很重要,这里有一个优化的解决方案与列表理解建设。你知道吗

[dict(zip(('label', 'value'), r)) for r in df[['Name', 'PlayerID']].values]

# [{'label': 'Abdelnaby, Alaa', 'value': 76001},
#  {'label': 'Abdul-Aziz, Zaid', 'value': 76002},
#  {'label': 'Abdul-Jabbar, Kareem', 'value': 76003},
#  {'label': 'Abdul-Rauf, Mahmoud', 'value': 51},
#  {'label': 'Abdul-Wahad, Tariq', 'value': 1505}]

如果速度是个问题,我们可以使用dict comp:

myjson = [{'label': name, 'value': pid} for pid,name in zip(df['PlayerID'], df['Name'])]

提供:

[{'label': 'Abdelnaby, Alaa', 'value': 76001},
 {'label': 'Abdul-Aziz, Zaid', 'value': 76002},
 {'label': 'Abdul-Jabbar, Kareem', 'value': 76003},
 {'label': 'Abdul-Rauf, Mahmoud', 'value': 51},
 {'label': 'Abdul-Wahad, Tariq', 'value': 1505}]

此外,如果要将数据写入json

import json
with open('myjson.json','w') as fo:
    json.dump(myjson,fo,indent=4)

速度比较

%%timeit
myjson = [{'label': name, 'value': pid} for pid,name in zip(df['PlayerID'].values, df['Name'].values)]

5.9 µs ± 125 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)



%%timeit
myjson = (df.reindex(['Name', 'PlayerID'], axis=1)
   .set_axis(['label', 'value'], axis=1, inplace=False)
   .to_dict('record')
)
756 µs ± 24.5 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

PlayerID Name当前球员上赛季第一个赛季 76001 Abdelnaby,Alaa 1990年至1994年 76002 Abdul Aziz,Zaid 1968 1977年 76003 Abdul Jabbar,Kareem 1969年至1988年 51 Abdul Rauf,Mahmoud 1990年至2000年 1505 Abdul Wahad,塔里克0 1997 2003

#You already have a data frame 
dataframe="your data frame"
#us iloc 
values=dataframe.iloc[:,0]# u have all rows n 0th col
label=dataframe.iloc[:,1] #u have all rows n 1st col
dic={}

    for i,val in values:
         dic[val]=lable[i]

#hope the logic is clear.

相关问题 更多 >