Pandas Dataframes值在aggfunc=sum的少数列上计数

NAME SHIFT DEP1 DEP2 DEP3 DAY COLLINS AM 1 1 0.5 01/02/2016 JOHNS PM 0.5 NA 0.5 02/02/2016 SMITH AM 1 0.5 NA 01/02/2016 RUBBER AM NA 1.5 1 03/02/2016 COLLINS PM NA 1 NA 02/02/2016

1条回答

网友

1楼 · 发布于 2024-10-01 15:43:13

您可以使用^{}创建掩码，然后使用双sum的^{}第一个是{a3}，第二个是{a4}：

print (df[['DEP1','DEP2','DEP3' ]].notnull())
    DEP1   DEP2   DEP3
0   True   True   True
1   True  False   True
2   True   True  False
3  False   True   True
4  False   True  False

print (df[['DEP1','DEP2','DEP3' ]].notnull().groupby([df.SHIFT]).sum())
       DEP1  DEP2  DEP3
SHIFT                  
AM      2.0   3.0   2.0
PM      1.0   1.0   1.0

df = df[['DEP1','DEP2','DEP3' ]].notnull().groupby([df.SHIFT]).sum().sum(axis=1)
print (df)
SHIFT
AM    7.0
PM    3.0
dtype: float64

另一个解决方案（感谢jeremycg ）和^{}：

^{pr2}$

也可以先按子集选择，然后应用count：

print (df[['DEP1','DEP2','DEP3' ]].groupby([df.SHIFT]).count())
       DEP1  DEP2  DEP3
SHIFT                  
AM        2     3     2
PM        1     1     1

df = df[['DEP1','DEP2','DEP3' ]].groupby([df.SHIFT]).count().sum(axis=1)
print (df)
SHIFT
AM    7
PM    3
dtype: int64

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas Dataframes值在aggfunc=sum的少数列上计数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >