前N行，直到找不到值

data = {'id_st': [100, 100, 100, 100, 100, 100, 100, 100, 100], 'year': [2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018], 'djma': [1000, 2200, 0, 3000, 1000, 0, 2000, 0, 0], 'taux': [np.nan, 0.9, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 0.7]} df = pd.DataFrame(data) df

1条回答

网友
1楼 · 发布于 2024-07-03 06:50:34

这是shift，确保如果存在连续的0，则使用前一个值填充：
m = df.djma.eq(0) df['prv_djma'] = df.djma.shift().mask((m == m.shift()) & m).ffill()
输出：
id_st year djma taux prev_djma 0 100 2010 1000 NaN NaN 1 100 2011 2200 0.9 1000.0 2 100 2012 0 1.1 2200.0 3 100 2013 3000 1.2 0.0 4 100 2014 1000 1.3 3000.0 5 100 2015 0 1.4 1000.0 6 100 2016 2000 1.5 0.0 7 100 2017 0 1.6 2000.0 8 100 2018 0 0.7 2000.0
对于组，您需要分别执行此操作，以便.shift不会溢出到组之外。你知道吗
def get_prv(x): m = x.eq(0) return x.shift().mask((m == m.shift()) & m).ffill() df['prv_djma'] = df.groupby('id_st')['djma'].apply(get_prv)

输出：

相关问题更多 >

编程相关推荐

热门问题

热门文章