使用pandas数据框迭代多列和行

idData idStation idCast Pressure 1 1 1 1505 2 1 1 1506 3 1 1 1507 4 1 1 1508 5 1 2 1505 6 1 2 1506 7 1 2 1503 8 1 2 1504 9 2 1 1505 10 2 1 1506 11 2 1 1507

1条回答

网友

1楼 · 发布于 2024-09-21 01:16:20

您可以使用boolean indexing，条件是每个组的Pressure值不低于该组的.cummax()。在

使用.groupby()来处理['idStation', 'idCast']的唯一子集。在
对于这些组中的每一组，检查当前的'Pressure'值是否低于正在运行的max（cummax()），并返回逆值{}（即False，如果该值低于此值）。结果从groupby()返回为.values。在
在boolean indexing中使用2.的结果删除符合条件的行。在

在pandas代码中，如下所示：

df[~df.groupby(['idStation', 'idCast']).apply(lambda x: x.Pressure < x.Pressure.cummax()).values]

获得：

^{pr2}$

您还可以消除@MaxU建议的.apply()步骤，以使玩具数据的速度提高约40%：

df[df.Pressure >= df.groupby(['idStation','idCast'])['Pressure'].cummax()]

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用pandas数据框迭代多列和行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >