查找每个组的唯一项目数

type number date type_2_before_type_1 1 1 2017-10-01 True 2 1 2017-10-31 True 1 2 2017-09-01 False 1 2 2017-08-01 False 2 2 2017-06-01 False

2条回答

网友

1楼 · 编辑于 2024-10-02 00:32:18

对于第一部分，使用groupby+nunique-

df.groupby('number').type.transform('nunique')

0    2
1    2
2    2
3    2
4    2
Name: type, dtype: int64

df = df[df.groupby('number').type.transform('nunique').gt(1)]

   type  number        date
0     1       1  2017-10-01
1     2       1  2017-10-31
2     1       2  2017-09-01
3     1       2  2017-08-01
4     2       2  2017-06-01

第二部分有点挑战性，但是你可以groupby，unstack，调用diff，然后得到一个掩码-

df['type_2_before_type_1'] = \
 df.groupby(['number', 'type'])\
      .first()\
      .unstack()\
      .diff(-1, axis=1)\
      .iloc[:, 0]\
      .reindex(df.number)\
      .astype(int)\
      .lt(0)\
      .values

df

   type  number       date  type_2_before_type_1
0     1       1 2017-10-01                  True
1     2       1 2017-10-31                  True
2     1       2 2017-09-01                 False
3     1       2 2017-08-01                 False
4     2       2 2017-06-01                 False

网友

2楼 · 编辑于 2024-10-02 00:32:18

g=df.groupby('number')
i=g.apply(lambda x : min(x['date'][x.type==1]))
j=g.apply(lambda x : min(x['date'][x.type==2]))
k=g.type.nunique()==2
df['New'] = df.number.map(~(i > j) & k)
df
Out[588]: 
   type  number       date    New
0     1       1 2017-10-01   True
1     2       1 2017-10-31   True
2     1       2 2017-09-01  False
3     1       2 2017-08-01  False
4     2       2 2017-06-01  False

相关问题更多 >

编程相关推荐

热门问题

热门文章

查找每个组的唯一项目数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >