嗨,我有一个数据框,有3列,如下所示。
我想使用Python Pandas
计算每个员工ID的最早“开始日期”。
例如
对于Employee_ID SNC1289037
,开始日期将为1/1/2020
,结束日期将为12/31/2999
,因为时间段中没有中断。
对于Employee_ID SNC2289038
,开始日期将为2020年1月3日,结束日期将为2999年12月31日,因为时间段中有一个中断
Employee_ID|Start_date | End_date
---------------------------------
SNC1289037 1/1/2020 1/31/2020
SNC1289037 2/1/2020 2/29/2020
SNC1289037 3/1/2020 3/30/2020
SNC1289037 4/1/2020 12/31/2999
SNC2289038 1/1/2020 1/31/2020
SNC2289038 3/1/2020 3/30/2020
SNC2289038 4/1/2020 12/31/2999
SNC4589038 1/1/2020 1/31/2020
SNC4589038 2/1/2020 2/29/2020
SNC4589038 3/1/2020 3/30/2020
非常感谢你的帮助
诸如2999年12月31日之类的日期会导致Datetime函数出现问题,即reference
假设:可以将日期限制在2199年12月31日(而不是2999年12月31日)
代码
输出
相关问题 更多 >
编程相关推荐