以其他两个变量为条件的变量的平均值创建列变量

2024-05-18 17:42:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据框,显示每个给定条件的平均值'dwdime'

DIMExCand_means = DIMExCand.groupby(['cycle', 'coded_state', 'party.orig', 'comtype']).mean()

我使用以下命令和输出从dimexc和\u means创建了一个pivot表:

DIMExCand_master = pd.pivot_table(DIMExCand_means,index=["Cycle","State"])

然而,一些数据在这个过程中丢失了。我想在'DIMExCand_master'数据框中添加一些列,这些列包含了'dwdime'平均得分,给出了'party.orig''comptype'的每个可能的组合,因为这将允许我每个'cycle'-'coded_state'有一个条目。你知道吗


Tags: 数据masterparty条件means平均值pivotstate
2条回答

谢谢!你知道吗

我最终选择了:

dimex和\u dime=pd.pivot表(DIMExCand,值='dwdime',索引[“Cycle”,“State”],列='ID',aggfunc=np.平均值)你知道吗

让我们试试:

DIMExCand_means = DIMExCand_means.reset_index()
DIMExCand_master = DIMExCand_master.reset_index()

pd.merge(DIMExCand_means, DIMExCand_master, left_on=['cycle','coded_state'], right_on=['Cycle','State'])

相关问题 更多 >

    热门问题