我有一个包含以下数据的数据帧:
Estimate Value Announce date Period Company
Estimate 1: 0,24 01-01-2015 31-12-2015 X
Estimate 2: 0,22 08-04-2015 31-12-2015 X
Estimate 3 0,26 07-05-2015 31-12-2014 Y
Estimate 4: 0,29 21-09-2015 31-12-2014 Y
Estimate 5: 0,21 30-09-2015 31-12-2013 Z
我只想包括每个时期和每个公司最早的估计数
示例:x公司在2015年12月31日有两个估计值,1和2,但估计值1的公布日期比估计值2早。因此我想删除估计值2的行,然后删除每个期间和公司的行
announcedate和period都是datetime
格式
什么是正确的方法
谢谢
IIUC然后就可以调用groupby对象上的^{} :
如果要对结果进行排序,请在
groupby
之前对df进行排序:一种方法是将数据按时段分组,然后按rank=1的子集进行排序:
相关问题 更多 >
编程相关推荐