从数据框架中的列中提取字典值

import pandas as pn a=[{'Feature1': 'aa1','Feature2': 'bb1','Feature3': 'cc2' }, {'Feature1': 'aa2','Feature2': 'bb2' }, {'Feature1': 'aa1','Feature2': 'cc1' } ] b=['num1','num2','num3'] df= pn.DataFrame({'num':b, 'dic':a })

Feature3=[] for idx, row in df['dic'].iteritems(): l=row.keys() if 'Feature3' in l: Feature3.append(row['Feature3']) else: Feature3.append(None) df['Feature3']=Feature3 print df

3条回答

网友

1楼 · 编辑于 2024-06-01 19:12:07

df['Feature3'] = df['dic'].apply(lambda x: x.get('Feature3'))

同意maxymoo。考虑更改数据帧的格式。

（旁注：熊猫一般作为pd进口）

网友

2楼 · 编辑于 2024-06-01 19:12:07

如果你applyaSeries，你会得到一个非常好的DataFrame：

>>> df.dic.apply(pn.Series)
    Feature1    Feature2    Feature3
0   aa1 bb1 cc2
1   aa2 bb2 NaN
2   aa1 cc1 NaN

从这一点上说，你可以使用常规的熊猫手术。

网友

3楼 · 编辑于 2024-06-01 19:12:07

您可以使用列表理解从数据框中的每一行提取功能3，返回一个列表。

feature3 = [d.get('Feature3') for d in df.dic]

如果'Feature3'不在dic中，则默认情况下返回None。

您甚至不需要panda，因为您可以再次使用列表理解从原始字典中提取功能。

feature3 = [d.get('Feature3') for d in a]

相关问题更多 >

编程相关推荐

热门问题

热门文章