通过变换最大值解决方案？

2条回答

网友

1楼 · 编辑于 2024-09-28 20:55:45

我们可以转换b^{}（如果还没有）（为了正确的排序行为），然后^{}，以便最大的b值是最后一个，然后^{}最后一个，并让索引对齐正确地关联这些值：

# df['b'] = pd.to_datetime(df['b'])  # Convert to_datetime if not already

df['c'] = df.sort_values('b').groupby('a')['c'].transform('last')

df：

     a          b    c
0  zx5 2021-01-01  bbb
1  zx5 2021-01-02  bbb
2  ab1 2021-01-03  ddd
3  ab1 2021-01-04  ddd
4  mn3 2021-01-05  eee
5  mn3 2021-01-04  eee

通过%timeit的一些定时：

%timeit df.sort_values('b').groupby('a')['c'].transform('last')
275 µs ± 6.23 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

%timeit df['a'].map(df.sort_values(by='b').groupby('a')['c'].last())
322 µs ± 8.28 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

网友

2楼 · 编辑于 2024-09-28 20:55:45

您可以按“a”+“b”排序，保留每个“a”组的最新“b”，并使用它映射新列“c”数据：

keys = df.sort_values(by='b').groupby('a')['c'].last()
df['c'] = df['a'].map(keys)

输出：

    a          b    c
0  A1 2021-01-01  bbb
1  A1 2021-01-02  bbb
2  A2 2021-01-03  ddd
3  A2 2021-01-04  ddd
4  A3 2021-01-05  eee
5  A3 2021-01-04  eee

相关问题更多 >

编程相关推荐

热门问题

热门文章

通过变换最大值解决方案？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >