我有一个名为panel_df
的面板数据集,包含以下列:id
、year
、month
和一个变量x
然后我通过下面一行:
panel_df.pivot_table(values=x, index='month', columns='year')
我获得的输出是一个y轴上有month
,x轴上有year
的表,因此每个单元格是由year
-month
对唯一标识的图形
我的疑问是:Python在执行上述代码行时做了什么?是否取横截面的平均值,即对于每个year
-month
对,取所有id
上x
的平均值
提前感谢大家抽出时间
Tags:
对于python版本0.23.4,默认情况下,相应的参数aggfunc设置为“平均值”:
https://pandas.pydata.org/pandas-docs/version/0.23.4/generated/pandas.DataFrame.pivot_table.html
因此,对于每个年-月对,pivot在所有相应的观测值中取x的平均值
然后:
相当于:
您可以将参数aggfunc的默认值更改为“sum”,例如:
您可能还会发现使用边距值并将其设置为True很有用:
相关问题 更多 >
编程相关推荐