在pandas datafram的每一行中查找第一列和最后一列非零

Name Jan17 Jun18 Dec18 Apr19 count Nick 0 1.7 3.7 0 2 Jack 0 0 2.8 3.5 2 Fox 0 1.7 0 0 1 Rex 1.0 0 3.0 4.2 3 Snack 0 0 2.8 4.4 2 Yosee 0 0 0 4.3 1 Petty 0.5 1.3 2.8 3.5 4

Name Jan17 Jun18 Dec18 Apr19 count Start Finish Nick 0 1.7 3.7 0 2 Jun18 Dec18 Jack 0 0 2.8 3.5 2 Dec18 Apr19 Fox 0 1.7 0 0 1 Jun18 Jun18 Rex 1.0 0 3.0 4.2 3 Jan18 Apr19 Snack 0 0 2.8 4.4 2 Dec18 Apr19 Yosee 0 0 0 4.3 1 Apr19 Apr19 Petty 0.5 1.3 2.8 3.5 4 Jan17 Apr19

3条回答

网友

1楼 · 编辑于 2024-09-28 21:18:36

在您的情况下，请尝试使用dot执行其他操作

s=df.loc[:,'Jan17':'Apr19'].ne(0)
s=s.dot(s.columns+',').str[:-1].str.split(',')
s.str[0],s.str[-1]
Out[899]: 
(0    Jun18
 1    Dec18
 2    Jun18
 3    Jan17
 4    Dec18
 5    Apr19
 6    Jan17
 dtype: object, 0    Dec18
 1    Apr19
 2    Jun18
 3    Apr19
 4    Apr19
 5    Apr19
 6    Apr19
 dtype: object)
 #df['Start'],df['End']=s.str[0],s.str[-1]

网友

2楼 · 编辑于 2024-09-28 21:18:36

`first_valid_index`和`last_valid_index`

d = df.mask(df == 0).drop(['Name', 'count'], 1)
df.assign(
    Start=d.apply(pd.Series.first_valid_index, 1),
    Finish=d.apply(pd.Series.last_valid_index, 1)
)

    Name  Jan17  Jun18  Dec18  Apr19  count  Start Finish
0   Nick    0.0    1.7    3.7    0.0      2  Jun18  Dec18
1   Jack    0.0    0.0    2.8    3.5      2  Dec18  Apr19
2    Fox    0.0    1.7    0.0    0.0      1  Jun18  Jun18
3    Rex    1.0    0.0    3.0    4.2      3  Jan17  Apr19
4  Snack    0.0    0.0    2.8    4.4      2  Dec18  Apr19
5  Yosee    0.0    0.0    0.0    4.3      1  Apr19  Apr19
6  Petty    0.5    1.3    2.8    3.5      4  Jan17  Apr19

`stack`然后`groupby`

^{pr2}$

网友

3楼 · 编辑于 2024-09-28 21:18:36

在底层array上使用cumsum

m = df.drop(['Name', 'count'], axis=1)
u = m.to_numpy().cumsum(1)

start = (u!=0).argmax(1)
end = u.argmax(1)

df.assign(start=m.columns[start], end=m.columns[end])

^{pr2}$

`first_valid_index`和`last_valid_index`

`stack`然后`groupby`

相关问题更多 >

编程相关推荐

热门问题

热门文章