熊猫计算时间序列中的零

date name elev_exact swe 0 1990-10-30 COTTONWOOD_CREEK 2337.816 0.01524 1 1990-10-30 EMIGRANT_SUMMIT 2252.472 0.00000 2 1990-10-30 PHILLIPS_BENCH 2499.360 0.05334 3 1990-10-30 PINE_CREEK_PASS 2048.256 0.00000 4 1990-10-30 SALT_RIVER_SUMMIT 2328.672 0.00000 5 1990-10-30 SEDGWICK_PEAK 2392.680 0.00000 6 1990-10-30 SHEEP_MTN 2026.920 0.00000 7 1990-10-30 SLUG_CREEK_DIVIDE 2202.180 0.00000 8 1990-10-30 SOMSEN_RANCH 2072.640 0.00000 9 1990-10-30 WILDHORSE_DIVIDE 1978.152 0.00000 10 1990-10-30 WILLOW_CREEK 2462.784 0.01778 11 1991-03-15 COTTONWOOD_CREEK 2337.816 0.41910 12 1991-03-15 EMIGRANT_SUMMIT 2252.472 0.42418 13 1991-03-15 PHILLIPS_BENCH 2499.360 0.52832 14 1991-03-15 PINE_CREEK_PASS 2048.256 0.32258 15 1991-03-15 SALT_RIVER_SUMMIT 2328.672 0.23876 16 1991-03-15 SEDGWICK_PEAK 2392.680 0.39878 17 1991-03-15 SHEEP_MTN 2026.920 0.31242 18 1991-03-15 SLUG_CREEK_DIVIDE 2202.180 0.29464 19 1991-03-15 SOMSEN_RANCH 2072.640 0.29972 20 1991-03-15 WILDHORSE_DIVIDE 1978.152 0.35052 21 1991-03-15 WILLOW_CREEK 2462.784 0.60706 22 1991-10-25 COTTONWOOD_CREEK 2337.816 0.01270 23 1991-10-25 EMIGRANT_SUMMIT 2252.472 0.01016 24 1991-10-25 PHILLIPS_BENCH 2499.360 0.02286 25 1991-10-25 PINE_CREEK_PASS 2048.256 0.00508 26 1991-10-25 SALT_RIVER_SUMMIT 2328.672 0.01016 27 1991-10-25 SEDGWICK_PEAK 2392.680 0.00254 28 1991-10-25 SHEEP_MTN 2026.920 0.00000 29 1991-10-25 SLUG_CREEK_DIVIDE 2202.180 0.00762 30 1991-10-25 SOMSEN_RANCH 2072.640 0.00000 31 1991-10-25 WILDHORSE_DIVIDE 1978.152 0.00508 32 1991-10-25 WILLOW_CREEK 2462.784 0.02032

result = pd.DataFrame() for name, group in df.groupby('date'): non_zero = group.where(group.swe >0).dropna() if not group.equals(non_zero): zeros = group.where(group.swe == 0).dropna() zero_kept = zeros.loc[zeros.elev_exact.idxmax()] out = non_zero.append(zero_kept) out = out[out.elev_exact >= zero_kept.elev_exact] result = pd.concat([result, out]) else: result = pd.concat([result, non_zero])

date name elev_exact swe 2 1990-10-30 PHILLIPS_BENCH 2499.360 0.05334 5 1990-10-30 SEDGWICK_PEAK 2392.680 0.00000 10 1990-10-30 WILLOW_CREEK 2462.784 0.01778 11 1991-03-15 COTTONWOOD_CREEK 2337.816 0.41910 12 1991-03-15 EMIGRANT_SUMMIT 2252.472 0.42418 13 1991-03-15 PHILLIPS_BENCH 2499.360 0.52832 14 1991-03-15 PINE_CREEK_PASS 2048.256 0.32258 15 1991-03-15 SALT_RIVER_SUMMIT 2328.672 0.23876 16 1991-03-15 SEDGWICK_PEAK 2392.680 0.39878 17 1991-03-15 SHEEP_MTN 2026.920 0.31242 18 1991-03-15 SLUG_CREEK_DIVIDE 2202.180 0.29464 19 1991-03-15 SOMSEN_RANCH 2072.640 0.29972 20 1991-03-15 WILDHORSE_DIVIDE 1978.152 0.35052 21 1991-03-15 WILLOW_CREEK 2462.784 0.60706 22 1991-10-25 COTTONWOOD_CREEK 2337.816 0.01270 23 1991-10-25 EMIGRANT_SUMMIT 2252.472 0.01016 24 1991-10-25 PHILLIPS_BENCH 2499.360 0.02286 26 1991-10-25 SALT_RIVER_SUMMIT 2328.672 0.01016 27 1991-10-25 SEDGWICK_PEAK 2392.680 0.00254 29 1991-10-25 SLUG_CREEK_DIVIDE 2202.180 0.00762 30 1991-10-25 SOMSEN_RANCH 2072.640 0.00000 32 1991-10-25 WILLOW_CREEK 2462.784 0.02032

1条回答

网友

1楼 · 发布于 2024-05-07 05:02:37

您可以尝试这样做，将数据帧拆分为非零和零，然后按最高elev\u exact对零数据帧进行排序，并将drop_duplicates与subset on date列一起使用。最后，使用pd.concat将dataframe重新连接在一起并排序：

df_nonzeroes = df[df['swe'].ne(0)]
df_zeroes = df[df['swe'].eq(0)].sort_values('elev_exact', ascending=False).drop_duplicates(subset=['date'])

df_out = pd.concat([df_nonzeroes, df_zeroes]).sort_index()
print(df_out)

输出：

          date               name  elev_exact      swe
0   1990-10-30   COTTONWOOD_CREEK    2337.816  0.01524
2   1990-10-30     PHILLIPS_BENCH    2499.360  0.05334
5   1990-10-30      SEDGWICK_PEAK    2392.680  0.00000
10  1990-10-30       WILLOW_CREEK    2462.784  0.01778
11  1991-03-15   COTTONWOOD_CREEK    2337.816  0.41910
12  1991-03-15    EMIGRANT_SUMMIT    2252.472  0.42418
13  1991-03-15     PHILLIPS_BENCH    2499.360  0.52832
14  1991-03-15    PINE_CREEK_PASS    2048.256  0.32258
15  1991-03-15  SALT_RIVER_SUMMIT    2328.672  0.23876
16  1991-03-15      SEDGWICK_PEAK    2392.680  0.39878
17  1991-03-15          SHEEP_MTN    2026.920  0.31242
18  1991-03-15  SLUG_CREEK_DIVIDE    2202.180  0.29464
19  1991-03-15       SOMSEN_RANCH    2072.640  0.29972
20  1991-03-15   WILDHORSE_DIVIDE    1978.152  0.35052
21  1991-03-15       WILLOW_CREEK    2462.784  0.60706
22  1991-10-25   COTTONWOOD_CREEK    2337.816  0.01270
23  1991-10-25    EMIGRANT_SUMMIT    2252.472  0.01016
24  1991-10-25     PHILLIPS_BENCH    2499.360  0.02286
25  1991-10-25    PINE_CREEK_PASS    2048.256  0.00508
26  1991-10-25  SALT_RIVER_SUMMIT    2328.672  0.01016
27  1991-10-25      SEDGWICK_PEAK    2392.680  0.00254
29  1991-10-25  SLUG_CREEK_DIVIDE    2202.180  0.00762
30  1991-10-25       SOMSEN_RANCH    2072.640  0.00000
31  1991-10-25   WILDHORSE_DIVIDE    1978.152  0.00508
32  1991-10-25       WILLOW_CREEK    2462.784  0.02032

相关问题更多 >

编程相关推荐

热门问题

热门文章