基于多列的Pandas aggfunc sum

inp = [{'Scenario':'Baseline', 'Region':'CHINA', 'Variable':'Methane', 'Unit':'MtCO2eq', '1990':5,'1995':10,'2000':15}, {'Scenario':'Baseline', 'Region':'INDIA', 'Variable':'Methane', 'Unit':'MtCO2eq', '1990':6,'1995':11,'2000':16}, {'Scenario':'Baseline', 'Region':'INDONESIA', 'Variable':'Methane', 'Unit':'MtCO2eq', '1990':7,'1995':12,'2000':17}, {'Scenario':'Baseline', 'Region':'KOREA', 'Variable':'Methane', 'Unit':'MtCO2eq', '1990':8,'1995':13,'2000':18}, {'Scenario':'Baseline', 'Region':'JAPAN', 'Variable':'Methane', 'Unit':'MtCO2eq', '1990':9,'1995':14,'2000':19}, {'Scenario':'Baseline', 'Region':'THAILAND', 'Variable':'Methane', 'Unit':'MtCO2eq', '1990':10,'1995':15,'2000':20}, {'Scenario':'Baseline', 'Region':'RUSSIA', 'Variable':'Methane', 'Unit':'MtCO2eq', '1990':11,'1995':16,'2000':21}] dt = pd.DataFrame(inp) dt 1990 1995 2000 Region Scenario Unit Variable 0 5 10 15 CHINA Baseline MtCO2eq Methane 1 6 11 16 INDIA Baseline MtCO2eq Methane 2 7 12 17 INDONESIA Baseline MtCO2eq Methane 3 8 13 18 KOREA Baseline MtCO2eq Methane 4 9 14 19 JAPAN Baseline MtCO2eq Methane 5 10 15 20 THAILAND Baseline MtCO2eq Methane 6 11 16 21 RUSSIA Baseline MtCO2eq Methane

1990 1995 2000 Region False True False True False True Scenario Variable Unit Baseline Methane MtCO2eq 46 10 76 15 106 20

1条回答

网友

1楼 · 发布于 2024-09-30 12:11:59

使用^{}：

print (dt_test.xs(True, axis=1, level=1))
                           1990  1995  2000
Scenario Variable Unit                     
Baseline Methane  MtCO2eq    26    46    66

但更好的方法是先按^{}和^{}进行筛选：

^{pr2}$

然后按组汇总sum：

dt_test = df.groupby(['Scenario','Variable','Unit']).sum()
print (dt_test)
                           1990  1995  2000
Scenario Variable Unit                     
Baseline Methane  MtCO2eq    26    46    66

相关问题更多 >

编程相关推荐

热门问题

热门文章