将透视表的元素设置为variab

2024-09-26 22:49:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个名为table1的透视表,它看起来像:

                       Volume
Site TripDate                
003l 1990-06-10   2354.043820
     1991-07-26   2745.673779
     1993-10-08  22789.790846
     1994-11-20  23072.306665
     1995-04-24  25203.740194
     1996-02-13  16505.985301
     1996-04-15   8257.426317
     1996-09-12   9148.369265
     1997-02-13  10014.168593
     1997-04-20  11154.686365
     1997-08-23  13064.444117
     1997-11-06  13704.596573
     1998-04-15  14358.140459
     1999-05-04  18100.457859
     2000-03-17  22910.600843
     2000-06-01    617.621794
     2001-10-05    882.738323
016l 1990-06-10    962.070643
     1991-07-26    761.409178
     1993-10-08    475.038362
     1994-11-20    312.339596
     1995-04-24  11569.523232
     1996-02-13  15272.175019
     1996-04-15  13542.057394
     1996-09-12  14556.930737
     1997-02-13  18905.265710
     1997-04-20  19832.509861

我有兴趣计算百分之体积为每个网站使用最早的体积计算作为“理论值”,以规范化的数据。对于每个站点,是否有方法直接从数据透视表中为最早的体积计算(即1990-06-10)定义一个变量

体积百分比的示例公式如下:

%Volume=(V_survey-V_1990)/(V_1990)

我已经厌倦了基于一级索引的子集使用:

test = table1[table1[['TripDate']]==1990-06-10]

但是,它抛出以下错误:

KeyError: "['TripDate'] not in index"

如果我使用list(table1.index.names)检查索引的名称,它将返回:

['Site', 'TripDate']

Tags: 数据方法index定义站点网站site体积
1条回答
网友
1楼 · 发布于 2024-09-26 22:49:48

我已经找到了我的问题的答案,尽管我确信有一个更优雅的解决办法

在开发我的解决方案时,我使用以下方法创建了一个具有最早日期的透视表:

query2 = query1[query1.TripDate=='1990-06-10']

其中query1是原始数据文件的子集

然后,我用类似于table1table2的方法创建了一个piviot表,使用:

table3 = pd.pivot_table(query2,values=['Volume'], index=['Site','TripDate'], aggfunc=np.sum)
table3 = table3.rename(columns = {'Volume':'Early_Vol'})

然后,我可以使用以下方法合并table1和表3`

merge = pd.merge(table1.reset_index(),table3.reset_index(),on=['Site'],how='left')

经过一点格式化后,我只剩下我想要的输出:

    Site   TripDate        Volume    Early_Vol
0   003l 1990-06-10   2354.043820  2354.043820
1   003l 1991-07-26   2745.673779  2354.043820
2   003l 1993-10-08  22789.790846  2354.043820
3   003l 1994-11-20  23072.306665  2354.043820
4   003l 1995-04-24  25203.740194  2354.043820
5   003l 1996-02-13  16505.985301  2354.043820
6   003l 1996-04-15   8257.426317  2354.043820
7   003l 1996-09-12   9148.369265  2354.043820
8   003l 1997-02-13  10014.168593  2354.043820
9   003l 1997-04-20  11154.686365  2354.043820
10  003l 1997-08-23  13064.444117  2354.043820
11  003l 1997-11-06  13704.596573  2354.043820
12  003l 1998-04-15  14358.140459  2354.043820
13  003l 1999-05-04  18100.457859  2354.043820
14  003l 2000-03-17  22910.600843  2354.043820
15  003l 2000-06-01    617.621794  2354.043820
16  003l 2001-10-05    882.738323  2354.043820
17  016l 1990-06-10    962.070643   962.070643
18  016l 1991-07-26    761.409178   962.070643
19  016l 1993-10-08    475.038362   962.070643
20  016l 1994-11-20    312.339596   962.070643
21  016l 1995-04-24  11569.523232   962.070643
22  016l 1996-02-13  15272.175019   962.070643
23  016l 1996-04-15  13542.057394   962.070643
24  016l 1996-09-12  14556.930737   962.070643
25  016l 1997-02-13  18905.265710   962.070643
26  016l 1997-04-20  19832.509861   962.070643
27  016l 1997-08-23  20914.494534   962.070643

相关问题 更多 >

    热门问题