我有一个类似这样的数据集。。。你知道吗
pd.DataFrame({
'car_id': ['1', '1', '1', '1', '1', '1', '1', '1', '1','1','1','1'],
'odometer_start': [0, 3, 6, 9, 13, 18, 39, 89, 101, 107, 122, 182],
'odometer_end': [3, 6, 9, 13, 18, 39, 89, 101, 107, 122, 182, 206],
'need_maintanince': [0,0,1,0,0,0,1,0,1,0,1,0]
})
我基本上是想把上一次a触发维修需求(=1)以来每次观察的里程表的差值加起来。你知道吗
所以我希望结果是这样的:
pd.DataFrame({
'car_id': ['1', '1', '1', '1', '1', '1', '1', '1', '1','1','1','1'],
'odometer_start': [0, 3, 6, 9, 13, 18, 39, 89, 101, 107, 122, 182],
'odometer_end': [3, 6, 9, 13, 18, 39, 89, 101, 107, 122, 182, 206],
'need_maintanince': [0,0,1,0,0,0,1,0,1,0,1,0],
'miles_since_maint': [0,0,0,4,9,30,80,12,18,15,75,24]})
基本上,它会查看每一个观察结果,并对同一个车号的观察结果被标记为需要维修后的累计里程进行累加。然后它将继续累计里程数,因为维修。你知道吗
作为参考,我试图预测汽车需要修理前的行驶里程数。你知道吗
有人知道怎么做吗?你知道吗
编辑:
我想我没有把预期的产出说得那么清楚。更新它以匹配我需要的,并使数据帧更容易解释,因为多个汽车id的困惑,甚至我。你知道吗
类似于匡宏的回答,但作为一个没有numpy的班轮:
结果:
IIUC公司:
给予
这似乎给出了您要查找的结果:
按评论编辑:
提供(转置以便于查看)
相关问题 更多 >
编程相关推荐