多指数熔体

2024-05-19 11:29:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我很难找到一个方法来重塑一个多索引(列)df的两种方式: (a) 多索引的两个级别都被熔化,除了一列和

(b)每根0级柱熔化1级柱

我可能已经发现了(a)虽然可能不是最有计划的方式,可以接近但没有雪茄(b)

例如,给定数据帧:

df = pd.DataFrame({'dealer': {0: 'SF', 1: 'LA'},
                   'col2': {0: 1, 1: 3},
                   'col3': {0: 2, 1: 4},
                   'col4': {0: 3, 1: 6},
                   'col5': {0: 7, 1: 2},
                  })
df.columns = [['Jan','Jan','Feb','Feb','dealer'], ['cars','trucks','cars','trucks','dealer']]

Out[209]: 
   Jan         Feb        dealer
  cars trucks cars trucks dealer
0    1      2    3      7     SF
1    3      4    6      2     LA

我可以通过以下方式到达(a):

melted = df.melt(id_vars = 'dealer',col_level=0, var_name='month')
melted['product']=df.melt(id_vars = 'dealer',col_level=1)['variable']
melted.sort_values('dealer', inplace=True)

melted
Out[211]: 
  dealer month  value product
1     LA   Jan      3    cars
3     LA   Jan      4  trucks
5     LA   Feb      6    cars
7     LA   Feb      2  trucks
0     SF   Jan      1    cars
2     SF   Jan      2  trucks
4     SF   Feb      3    cars
6     SF   Feb      7  trucks

但似乎无法正确地将['dealer'、'product'、'Jan'、'Feb']作为列标签,并在Jan和Feb列中使用值

pivotedd =  pd.DataFrame({'dealer': {0: 'LA', 1: 'LA',2: 'SF', 3: 'SF'},
                   'product': {0: 'cars', 1: 'trucks',2: 'cars', 3: 'trucks'},
                   'Jan': {0: 3, 1: 4,2:1,3:2},
                   'Feb': {0: 6, 1: 2,2:3,3:7},
                  })

Out[215]: 
   Feb  Jan dealer product
0    6    3     LA    cars
1    2    4     LA  trucks
2    3    1     SF    cars
3    7    2     SF  trucks

显然,我希望经销商和产品的第一列和日期按时间顺序(还没有读到为什么)pd.数据帧改变了你输入数据的顺序),但这基本上就是我想要的。你知道吗

提前谢谢!你知道吗


Tags: 数据df方式sfproductoutcarsla

热门问题