如何使字典键是数据帧中的一列到列中？

speakers = ['Einstein','Newton'] views = [1000,2000] ratings0 = ("[{'id': 7, 'name': 'Funny', 'count': 100}, {'id': 1, 'name': 'Sad', " "'count': 110}, {'id': 9, 'name': 'Happy', 'count': 120}]") ratings1 = ("[{'id': 7, 'name': 'Happy', 'count': 200}, {'id': 3, 'name': 'Funny', " "'count': 210}, {'id': 2, 'name': 'Sad', 'count': 220}]") ratings = [ratings0, ratings1] df = pd.DataFrame({'speaker': speakers, 'ratings': ratings,'views':views}) print(df) speaker ratings views 0 Einstein [{'id': 7, 'name': 'Funny', 'count': 100}, {'i... 1000 1 Newton [{'id': 7, 'name': 'Happy', 'count': 200}, {'i... 2000

# new dataframe only for ratings dfr = df['ratings'].apply(ast.literal_eval) dfr = dfr.apply(pd.DataFrame) dfr = dfr.apply(lambda x: x.sort_values(by='name')) dfr = dfr.apply(pd.DataFrame.stack) print(dfr) 0 1 2 count id name count id name count id name 0 100 7 Funny 110 1 Sad 120 9 Happy 1 200 7 Happy 210 3 Funny 220 2 Sad

3条回答

网友

1楼 · 编辑于 2024-10-04 09:31:58

对于pandas >= 0.25.0，可以使用ast.literal_eval+explode+pivot

ii = df.set_index('speaker')['ratings'].apply(ast.literal_eval).explode()

u = pd.DataFrame(ii.tolist(), index=ii.index).reset_index()

u.pivot('speaker', 'name', 'count')

name      Funny  Happy  Sad
speaker
Einstein    100    120  110
Newton      210    200  220

对于旧版本的pandas

a = df['speaker']
b = df['ratings']

ii = [
  {**{'speaker': name}, **row}
  for name, element in zip(a, b) for row in ast.literal_eval(element)
]

pd.DataFrame(ii).pivot('speaker', 'name', 'count')

网友

2楼 · 编辑于 2024-10-04 09:31:58

因为循环并不总是坏的。你可以试一试：

dfr = pd.DataFrame(columns=['id','name','count'])

for i in range(len(df)):
    x = pd.DataFrame(df['ratings'].apply(ast.literal_eval)[i])
    x.index = [i]*len(x)
    dfr = dfr.append(x)


dfr = dfr.reset_index()   
dfr = (dfr.drop('id',axis=1)
         .pivot_table(index=['index'], columns='name',
                      values='count',aggfunc='sum')
         .rename_axis(None, axis=1).reset_index())

df_final = df.join(dfr)
df_final.drop(['index','ratings'],axis=1,inplace=True)

df_final

提供：

    speaker  views  Funny  Happy  Sad
0  Einstein   1000    100    120  110
1    Newton   2000    210    200  220

网友

3楼 · 编辑于 2024-10-04 09:31:58

您可以使用sum、index.repeat来构造一个新的数据帧，并将其加入df[['speaker', 'views']]并将其分配给df1。接下来是set_index、unstack和reset_index

df['ratings'] = df['ratings'].apply(ast.literal_eval)
df1 = (pd.DataFrame(df.ratings.sum(), index=df.index.repeat(df.ratings.str.len()))
                   .drop('id', 1).join(df[['speaker', 'views']]))
df1.set_index(['speaker', 'views', 'name'])['count'].unstack().reset_index()

Out[213]:
name   speaker  views  Funny  Happy  Sad
0     Einstein  1000   100    120    110
1     Newton    2000   210    200    220

注意：name在最终输出中是列轴的标签。如果您不想看到它，只需按如下方式链接附加的rename_axis

df1.set_index(['speaker', 'views', 'name'])['count'].unstack().reset_index() \
                                                    .rename_axis([None], axis=1)

Out[214]:
    speaker  views  Funny  Happy  Sad
0  Einstein  1000   100    120    110
1  Newton    2000   210    200    220

最终通缉方案

相关问题更多 >

编程相关推荐

热门问题

热门文章