基于列数重构数据帧

2024-10-01 07:51:08 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下数据框

ID   Col1   Col2   Col3   Col4   Col5   Col6   Col7   Col8   Col9
1     A      B       C      A     B      C      A      B      C
2     D      E       F      D     E      F      D      E      F 

我希望通过每三列重新构造一个值,得到下表

ID   Col_1   Col_2   Col_3
1      A       B       C
       A       B       C
       A       B       C

2      D       E       F
       D       E       F
       D       E       F

ID   Col_1   Col_2   Col_3
1      A       B       C
1      A       B       C
1      A       B       C
2      D       E       F
2      D       E       F
2      D       E       F

有什么有效的方法吗?我试图在StackOverflow社区找到类似的例子,但没有找到。如果有,你可以指给我看

感谢您的帮助


Tags: 数据方法idcolstackoverflow社区col2col3
3条回答

下面是一个带有apply^{}的:

f = lambda x: pd.DataFrame(np.reshape(x.to_numpy(),(-1,3))).add_prefix('Col_')
df.groupby('ID').apply(f).reset_index('ID')

   ID Col_0 Col_1 Col_2
0   1     A     B     C
1   1     A     B     C
2   1     A     B     C
3   2     D     E     F
4   2     D     E     F
5   2     D     E     F

我不确定是否有效率,但它是有效的:

k = 3  # every k column
pd.DataFrame([df.values[:,[n,n+k,n+k]].flatten() for n in range(k)]).T

   0  1  2
0  A  B  C
1  A  B  C
2  A  B  C
3  D  E  F
4  D  E  F
5  D  E  F

您可以使用^{}MultiIndex被所有列使用,而不使用由整数和模除法创建的ID

df = df.set_index('ID')
c = np.arange(len(df.columns))
df.columns = [c // 3, c % 3]
df1 = (df.stack()
         .reset_index(level=1, drop=True)
         .rename(columns= lambda x: f'Col_{x+1}')
         .reset_index())
print (df1)
   ID Col_1 Col_2 Col_3
0   1     A     A     A
1   1     B     B     B
2   1     C     C     C
3   2     D     D     D
4   2     E     E     E
5   2     F     F     F

相关问题 更多 >