透视数据帧并计算“columns”参数

import pandas as pd df = pd.DataFrame() df['ID'] = [1, 1, 1, 2, 2] df['Type'] = ['A', 'B', 'Q', 'B', 'R'] df['Status'] = [0, 0, 1, 0, 1] >>> df ID Type Status 0 1 A 0 1 1 B 0 2 1 Q 1 3 2 B 0 4 2 R 1 >>>

>>> g=df.groupby('ID') >>> df['IDinGroup']=[item for sublist in [range(1,len(i[1])+1) for i in g] for item in sublist] >>> df ID Type Status IDinGroup 0 1 A 0 1 1 1 B 0 2 2 1 Q 1 3 3 2 B 0 1 4 2 R 1 2 >>>

>>> ListOfValues=[] >>> for ValueCol in ['Type','Status']: ... f=df.pivot(index='ID',columns='IDinGroup',values=ValueCol) ... f.columns=[ValueCol+str(Col) for Col in f.columns] ... f.columns.name=None ... ListOfValues.append(f) ... >>> pd.concat(ListOfValues,1) Type1 Type2 Type3 Status1 Status2 Status3 ID 1 A B Q 0 0 1 2 B R NaN 0 1 NaN >>>

1条回答

网友

1楼 · 发布于 2024-10-03 15:23:54

试试这个：

import pandas as pd

df = pd.DataFrame()
df['ID'] = [1, 1, 1, 2, 2]
df['Type'] = ['A', 'B', 'Q', 'B', 'R']
df['Status'] = [0, 0, 1, 0, 1]

g = df.groupby("ID")[["Type","Status"]]
df2 = g.apply(pd.DataFrame.reset_index, drop=True).unstack()

结果如下：

   Type         Status       
      0  1    2      0  1   2
ID                           
1     A  B    Q      0  0   1
2     B  R  NaN      0  1 NaN

列是一个多索引，如果要展开它：

df2.columns = [l0 + str(l1+1) for l0, l1 in df2.columns]

输出：

   Type1 Type2 Type3  Status1  Status2  Status3
ID                                             
1      A     B     Q        0        0        1
2      B     R   NaN        0        1      NaN

相关问题更多 >

编程相关推荐

热门问题

热门文章