Pandas groupby，然后选择on

3条回答

网友

1楼 · 编辑于 2024-04-25 13:55:35

按日期排序，然后抓住第一行。在

df.sort_values('date').groupby(['id', 'period', 'type']).first()

网友

2楼 · 编辑于 2024-04-25 13:55:35

用最短日期的索引筛选df。
idxmin得到该索引。然后将其传递给loc。在

df.loc[df.groupby(['id', 'period', 'type']).date.idxmin()]

考虑df

^{pr2}$

那么

df.loc[df.groupby(['id', 'period', 'type']).date.idxmin()]

  id period type       date
0  a      q    y 2011-03-31
4  b      q    x 2011-01-31

网友

3楼 · 编辑于 2024-04-25 13:55:35

也可以使用nsmallest()：

df.groupby(['id', 'period', 'type']).apply(lambda g: g.nsmallest(1, "date"))