在dataframe中使用groupby时，如何基于前一行中的值增加列？

claim diagnosis sequence 100 1 1.0 100 2 1.0 100 3 NaN 100 4 NaN 105 1 1.0 105 2 2.0 105 3 2.0 105 4 NaN 111 1 1.0 111 2 2.0 111 3 3.0 111 4 NaN

claim diagnosis sequence 100 1 1.0 100 2 1.0 100 3 2.0 100 4 3.0 105 1 1.0 105 2 2.0 105 3 2.0 105 4 3.0 111 1 1.0 111 2 2.0 111 3 3.0 111 4 4.0

things = [{'claim':100, 'diagnosis':1, 'sequence':1}, {'claim':100, 'diagnosis':2, 'sequence':1 }, {'claim':100, 'diagnosis':3, }, {'claim':100, 'diagnosis':4, }, {'claim':105, 'diagnosis':1, 'sequence':1}, {'claim':105, 'diagnosis':2, 'sequence':2}, {'claim':105, 'diagnosis':3,'sequence':2 }, {'claim':105, 'diagnosis':4, }, {'claim':111, 'diagnosis':1, 'sequence':1}, {'claim':111, 'diagnosis':2, 'sequence':2}, {'claim':111, 'diagnosis':3, 'sequence':3}, {'claim':111, 'diagnosis':4, }] df = pd.DataFrame(things) df

1条回答

网友

1楼 · 发布于 2024-09-28 20:16:00

使用cumsum计算该行前面有多少个NaN，然后加上ffill

s1=df['sequence'].isnull().groupby(df['claim']).cumsum()
df['sequence']=s1+df.groupby('claim')['sequence'].ffill()
df
Out[145]: 
    claim  diagnosis  sequence
0     100          1       1.0
1     100          2       1.0
2     100          3       2.0
3     100          4       3.0
4     105          1       1.0
5     105          2       2.0
6     105          3       2.0
7     105          4       3.0
8     111          1       1.0
9     111          2       2.0
10    111          3       3.0
11    111          4       4.0

相关问题更多 >

编程相关推荐

热门问题

热门文章