标识数据帧中每行中的第一个和所有非零值

data=pd.DataFrame([['Juan',0,0,400,450,500],['Luis',100,100,100,100,100],[ 'Maria',0,20,50,300,500],[ 'Laura',0,0,0,100,900],['Lina',0,0,0,0,10]]) data.columns=['Name','Date1','Date2','Date3','Date4','Date5'] Name Date1 Date2 Date3 Date4 Date5 0 Juan 0 0 400 450 500 1 Luis 100 100 100 100 100 2 Maria 0 20 50 300 500 3 Laura 0 0 0 100 900 4 Lina 0 0 0 0 10

Name Date1 Date2 Date3 Date4 Date5 0 Juan 0 0 1 1 1 1 Luis 1 1 1 1 1 2 Maria 0 1 1 1 1 3 Laura 0 0 0 1 1 4 Lina 0 0 0 0 1

Name Date1 Date2 Date3 Date4 Date5 0 Juan 0 0 1 0 0 1 Luis 1 0 0 0 0 2 Maria 0 1 0 0 0 3 Laura 0 0 0 1 0 4 Lina 0 0 0 0 1

1条回答

网友

1楼 · 发布于 2024-05-03 03:26:11

对于第一种情况，您可以只选择数值列，并在^{}中用1替换非0值，然后对于第二种情况，使用^{}比较第一个1值和^{}转换为整数的布尔掩码，添加每axis=1的累积和：

df1, df2 = data.copy(), data.copy()
cols = df1.select_dtypes(include=np.number).columns
df1[cols] = df1[cols].mask(data[cols].ne(0), 1)

df2[cols] = df1[cols].cumsum(axis=1).eq(1).astype(int)
print(df1)
    Name  Date1  Date2  Date3  Date4  Date5
0   Juan      0      0      1      1      1
1   Luis      1      1      1      1      1
2  Maria      0      1      1      1      1
3  Laura      0      0      0      1      1
4   Lina      0      0      0      0      1

print(df2)
    Name  Date1  Date2  Date3  Date4  Date5
0   Juan      0      0      1      0      0
1   Luis      1      0      0      0      0
2  Maria      0      1      0      0      0
3  Laura      0      0      0      1      0
4   Lina      0      0      0      0      1

相关问题更多 >

编程相关推荐

热门问题

热门文章