基于自定义可能值列表的Groupby数据帧

s a Michaels FS 2 fds 1 fnfe 1 ssn 0 adg 0 Rogers FS 1 fds 2 ssn 1 fnfe 0 adg 0

1条回答

网友

1楼 · 发布于 2024-09-27 19:17:28

与^{}一起使用与^{}一起使用，并向具有唯一值的列表中添加值：

out = df.groupby(by=["s", "a"]).size()

s = df['s'].unique()
a = df['a'].unique().tolist() + ['adg']

out = out.reindex(pd.MultiIndex.from_product([s, a], names=['s','a']), fill_value=0)

print (out)
s         a   
Michaels  FS      2
          fds     1
          fnfe    1
          ssn     0
          adg     0
Rogers    FS      1
          fds     2
          fnfe    0
          ssn     1
          adg     0
dtype: int64

您的解决方案：

a = df['a'].unique().tolist() + ['adg']

out = (df.groupby(by=["s", "a"]).size()
         .unstack(fill_value=0)
         .reindex(a, fill_value=0, axis=1)
         .stack())

print (out)
s         a   
Michaels  FS      2
          fds     1
          fnfe    1
          ssn     0
          adg     0
Rogers    FS      1
          fds     2
          fnfe    0
          ssn     1
          adg     0
dtype: int64

另一个想法是使用Categorical：

df['a'] = pd.Categorical(df['a'], categories=df['a'].unique().tolist() + ['adg'])

out = df.groupby(by=["s", "a"]).size()
print (out)
s         a   
Michaels  FS      2
          fds     1
          fnfe    1
          ssn     0
          adg     0
Rogers    FS      1
          fds     2
          fnfe    0
          ssn     1
          adg     0
dtype: int64

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于自定义可能值列表的Groupby数据帧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >