在Pandas中，如何展平一组行

event event_date event_time name_1 height_1 age_1 name_2 height_2 age_2 name_3 height_3 age_3 1 2015-05-06 14:00 J Bloggs 185 24 P Smith 176 55 T Kirk 193 22 2 2015-05-14 17:00 B Gates 178 72 J Mayer 184 42 .

2条回答

网友

1楼 · 编辑于 2024-06-26 03:20:58

你把一张长桌子改成了一张宽桌子。通常，在数据分析中，您希望执行相反的操作。下面是一个方法，它首先统计每个变量名称、高度和年龄的出现次数，然后按您想要的方式旋转它们

df['group_num'] = df.groupby(['event', 'event_date','event_time']).cumcount() + 1
df = df.sort_values('group_num')
df1 = df.set_index(['event', 'event_date','event_time', 'group_num']).stack().reset_index()
df1['var_names'] = df1['level_4'] + '_' + df1['group_num'].astype(str)
df1 = df1.drop(['group_num', 'level_4'], axis=1)
df1.set_index(['event', 'event_date', 'event_time', 'var_names']).squeeze().unstack('var_names')

var_names                   age_1 age_2 age_3 height_1 height_2 height_3  \
event event_date event_time                                                
1     2015-05-06 14:00         24    55    22      185      176      193   
2     2015-05-14 17:00         72    42  None      178      184     None   

var_names                      name_1   name_2  name_3  
event event_date event_time                             
1     2015-05-06 14:00       J Bloggs  P Smith  T Kirk  
2     2015-05-14 17:00        B Gates  J Mayer    None

网友

2楼 · 编辑于 2024-06-26 03:20:58

步骤：

1）计算Groupby对象的累积计数。添加1，使标题按照所需的DF进行格式化

2）设置与索引轴相同的分组列以及计算出的cumcounts和unstack列。此外，根据最低级别对标题进行排序

3）重命名多索引列并相应展平以获得单个标题

cc = df.groupby(['event','event_date','event_time']).cumcount() + 1
df = df.set_index(['event','event_date','event_time', cc]).unstack().sort_index(1, level=1)
df.columns = ['_'.join(map(str,i)) for i in df.columns]
df.reset_index()

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Pandas中，如何展平一组行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >