根据要计数的条件按计数分组

df = pd.DataFrame({'Data1' : ['A', 'A', 'A', 'B', 'B', 'B'], 'Data2' : [100, 100, 200, 100, 100, 100], 'Data3' : [1, 2, 3, 1, 1, 1], 'State' : ['On', 'On', 'Off', 'Off', 'On', 'On']})

+-------+-------+-------+-------+ | Data1 | Data2 | Data3 | State | +-------+-------+-------+-------+ | A | 100 | 1 | On | | A | 100 | 2 | On | | A | 200 | 3 | Off | | B | 100 | 1 | Off | | B | 100 | 1 | On | | B | 100 | 1 | On | +-------+-------+-------+-------+

+-------+-------+-------+-------+-------+ | Data1 | Data2 | Data3 | State | Count | +-------+-------+-------+-------+-------+ | A | 100 | 1 | On | 2 | | A | 100 | 2 | On | 2 | | A | 200 | 3 | Off | 0 | | B | 100 | 1 | Off | 1 | | B | 100 | 1 | On | 1 | | B | 100 | 1 | On | 1 | +-------+-------+-------+-------+-------+

2条回答

网友

1楼 · 编辑于 2024-09-24 06:34:07

您还可以使用groupby.nunique和左合并来执行布尔掩码：

cols = ['Data1','Data2']
m = df[df['State'].eq("On")].groupby(cols)['Data3'].nunique()
out = (df.merge(m,left_on=cols,right_index=True,how='left',suffixes=('','_counts'))
       .fillna({"Data3_counts":0}))

print(out)

  Data1  Data2  Data3 State  Data3_counts
0     A    100      1    On           2.0
1     A    100      2    On           2.0
2     A    200      3   Off           0.0
3     B    100      1   Off           1.0
4     B    100      1    On           1.0
5     B    100      1    On           1.0

网友

2楼 · 编辑于 2024-09-24 06:34:07

让我们试试reindex

df['Count'] = df[df['State'].eq('On')].groupby(['Data1','Data2'])['Data3'].nunique().reindex(df.Data3).values

相关问题更多 >

编程相关推荐

热门问题

热门文章