Pandas Dataframe MultiIndex将多索引的一个级别转换为另一个轴，同时将另一个级别保留在原始轴上

2条回答

网友

1楼 · 编辑于 2024-09-29 18:52:57

由于某些条目有NaN值，因此在取消其中一个索引时，您可能需要考虑pivot table，以避免“重复条目”值错误。在

假设您有df数据帧，列'SlabLT'，索引为date和{}，请尝试：

df.reset_index().pivot_table(values = 'SlabLT', index = 'date', columns = 'SlabLT')

网友

2楼 · 编辑于 2024-09-29 18:52:57

将^{}与选择列SlabLT一起使用：

print (df['SlabLT'].unstack())

但是如果MultiIndex中可能的重复是必需的聚合列，例如mean：

^{pr2}$

样本：

df = pd.DataFrame({'date':['2017-10-01','2017-10-08','2017-10-08','2017-10-15', '2017-10-15'],
                   'SlabType':['UOM2','AMOUNT','UOM2','AMOUNT','AMOUNT'],
                   'SlabLT':[1,6000,1,6000,5000]}).set_index(['date','SlabType'])

print (df)
                     SlabLT
date       SlabType        
2017-10-01 UOM2           1
2017-10-08 AMOUNT      6000
           UOM2           1
2017-10-15 AMOUNT      6000 <-duplicated MultiIndex '2017-10-15', 'AMOUNT'
           AMOUNT      5000 <-duplicated MultiIndex '2017-10-15', 'AMOUNT'

print (df['SlabLT'].unstack())

ValueError: Index contains duplicate entries, cannot reshape

print (df.groupby(level=[0,1])['SlabLT'].mean())
date        SlabType
2017-10-01  UOM2           1
2017-10-08  AMOUNT      6000
            UOM2           1
2017-10-15  AMOUNT      5500
Name: SlabLT, dtype: int64

print (df.groupby(level=[0,1])['SlabLT'].mean().unstack())
SlabType    AMOUNT  UOM2
date                    
2017-10-01     NaN   1.0
2017-10-08  6000.0   1.0
2017-10-15  5500.0   NaN

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas Dataframe MultiIndex将多索引的一个级别转换为另一个轴，同时将另一个级别保留在原始轴上

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >