我对熊猫比较陌生,已经尝试过搜索,但我找不到解决办法。 我有一个带有交易编号、customerId和购买日期的数据框,如下所示:
Transaction 12345 12346 12347 12348 12349
customerID
1 NaN 2019-09-01 NaN 2019-09-11 2019-09-22...
2 2019-10-01 NaN NaN NaN 2019-10-07...
3 ...
数据帧有[6334行x 8557列]。 每行都有NaN值,因为事务编号是唯一的
我想计算每行的日期差,以便
customerID Datedifference1 Datedifference2 etc.
1 10 11
2 6
3 ...
我很难得到一个每个客户ID的日期差异列表。 有没有一种方法可以忽略数据帧中的NaN,而只计算非NaN的值? 我想有一个带有customerId和datediff的列表,在购买1和2之间,2和3之间,等等,以估计下一次购买之前的天数
有解决办法吗
想法是通过^{} 重新塑造数据,然后获得差异,删除每个组的第一个缺失值并重新塑造:
编辑:如果输入数据不同,解决方案将更改-将列转换为日期时间,通过^{} 为差异创建新列,通过^{} 仅删除} 和} 重新整形:
NaN
行,最后通过^{unstack
通过Series
计数器^{相关问题 更多 >
编程相关推荐