我有一个包含JIRA票证状态快照的df,df包含这些票证的多个快照,因此有一些重复。我想用当前最新的票证状态填充以前快照中的空值(只要id在某一点上为空)
例如:
snapshot id status date
week1 111 Null 2019-10-10
week2 111 Null 2019-10-17
week3 111 Analysis 2019-10-23
我想将week1和week2的状态更改为analysis
另一种情况是:
snapshot id status date
week1 111 Null 2019-10-10
week2 111 Triage 2019-10-17
week3 111 Analysis 2019-10-23
第2周是分类,但最新的第3周是分析,df仍应更改为:
snapshot id status date
week1 111 Analysis 2019-10-10
week2 111 Analysis 2019-10-17
week3 111 Analysis 2019-10-23
您可以将
NaN
分配给所有没有max
日期的行,然后使用backfill (bfill)
分配给fillna
注意
如果您的
date
列还没有datetime类型,请首先转换它:我将按
id
分组,只选择状态为Null的id,并用最后一个状态替换这些组中的所有状态值。代码可以是:如果
date
列的类型为string或date,则该方法的效果相同相关问题 更多 >
编程相关推荐