我有一个包含11列的数据帧:Status1-Status5,Time1-Time5&Time\u Min
df = pd.DataFrame([[100,200,150,400,500,'a','b','a','c','a',100], [300,400,200,500,250,'b','b','c','c','c',200]], columns=['TIME_1', 'TIME_2', 'TIME_3', 'TIME_4', 'TIME_5','STATUS_1','STATUS_2','STATUS_3','STATUS_4','STATUS_5','TIME_MIN'])
我想复制一个我目前在SAS中的代码,它可以执行以下操作
IF TIME_1 = TIME_MIN THEN STATUS = STATUS_1;
ELSE IF TIME_2 = TIME_MIN THEN STATUS = STATUS_2;
ELSE IF TIME_3 = TIME_MIN THEN STATUS = STATUS_3;
ELSE IF TIME_4 = TIME_MIN THEN STATUS = STATUS_4;
ELSE STATUS = STATUS_5;
列状态的预期输出为
['a','c']
我试着沿着这条线建造一些东西(这需要用其他的ifs来扩展)
df['STATUS'] = [a if x == y else b for x,y,a,b in df[['TIME_MIN','TIME_1','STATUS_1','STATUS_2']]]
但这只是一个错误。我相信这是个简单的解决办法,但我不太明白。
不是很漂亮,但是您可以在^{} method 中使用相等广播。
你可以写一个函数
或者使用一个非常嵌套的np
相关问题 更多 >
编程相关推荐