我很难找到一个方法来重塑一个多索引(列)df的两种方式: (a) 多索引的两个级别都被熔化,除了一列和
(b)每根0级柱熔化1级柱
我可能已经发现了(a)虽然可能不是最有计划的方式,可以接近但没有雪茄(b)
例如,给定数据帧:
df = pd.DataFrame({'dealer': {0: 'SF', 1: 'LA'},
'col2': {0: 1, 1: 3},
'col3': {0: 2, 1: 4},
'col4': {0: 3, 1: 6},
'col5': {0: 7, 1: 2},
})
df.columns = [['Jan','Jan','Feb','Feb','dealer'], ['cars','trucks','cars','trucks','dealer']]
Out[209]:
Jan Feb dealer
cars trucks cars trucks dealer
0 1 2 3 7 SF
1 3 4 6 2 LA
我可以通过以下方式到达(a):
melted = df.melt(id_vars = 'dealer',col_level=0, var_name='month')
melted['product']=df.melt(id_vars = 'dealer',col_level=1)['variable']
melted.sort_values('dealer', inplace=True)
melted
Out[211]:
dealer month value product
1 LA Jan 3 cars
3 LA Jan 4 trucks
5 LA Feb 6 cars
7 LA Feb 2 trucks
0 SF Jan 1 cars
2 SF Jan 2 trucks
4 SF Feb 3 cars
6 SF Feb 7 trucks
但似乎无法正确地将['dealer'、'product'、'Jan'、'Feb']作为列标签,并在Jan和Feb列中使用值
pivotedd = pd.DataFrame({'dealer': {0: 'LA', 1: 'LA',2: 'SF', 3: 'SF'},
'product': {0: 'cars', 1: 'trucks',2: 'cars', 3: 'trucks'},
'Jan': {0: 3, 1: 4,2:1,3:2},
'Feb': {0: 6, 1: 2,2:3,3:7},
})
Out[215]:
Feb Jan dealer product
0 6 3 LA cars
1 2 4 LA trucks
2 3 1 SF cars
3 7 2 SF trucks
显然,我希望经销商和产品的第一列和日期按时间顺序(还没有读到为什么)pd.数据帧改变了你输入数据的顺序),但这基本上就是我想要的。你知道吗
提前谢谢!你知道吗
您可以尝试:
相关问题 更多 >
编程相关推荐