根据日期比较删除行

Estimate Value Announce date Period Company Estimate 1: 0,24 01-01-2015 31-12-2015 X Estimate 2: 0,22 08-04-2015 31-12-2015 X Estimate 3 0,26 07-05-2015 31-12-2014 Y Estimate 4: 0,29 21-09-2015 31-12-2014 Y Estimate 5: 0,21 30-09-2015 31-12-2013 Z

2条回答

网友

1楼 · 编辑于 2024-10-03 02:45:05

IIUC然后就可以调用groupby对象上的^{}：

In [191]:
df.groupby(['Period','Company']).first()

Out[191]:
                      Estimate Value AnnounceDate
Period     Company                               
2013-12-31 Z        Estimate5:  0,21   2015-09-30
2014-12-31 Y        Estimate3:  0,26   2015-07-05
2015-12-31 X        Estimate1:  0,24   2015-01-01

如果要对结果进行排序，请在groupby之前对df进行排序：

In [194]:
df.sort(columns='AnnounceDate').groupby(['Period','Company']).first()

Out[194]:
                      Estimate Value AnnounceDate
Period     Company                               
2013-12-31 Z        Estimate5:  0,21   2015-09-30
2014-12-31 Y        Estimate3:  0,26   2015-07-05
2015-12-31 X        Estimate1:  0,24   2015-01-01

网友

2楼 · 编辑于 2024-10-03 02:45:05

一种方法是将数据按时段分组，然后按rank=1的子集进行排序：

from io import StringIO
import pandas as pd

s = u"""Estimate Value AnnounceDate Period Company
Estimate1: 0,24 01-01-2015 31-12-2015 X
Estimate2: 0,22 08-04-2015 31-12-2015 X
Estimate3: 0,26 07-05-2015 31-12-2014 Y
Estimate4: 0,29 21-09-2015 31-12-2014 Y
Estimate5: 0,21 30-09-2015 31-12-2013 Z"""

df = pd.read_csv(StringIO(s), delimiter=" ")
df['Rank'] = df.groupby(['Period','Company'])['AnnounceDate'].rank(ascending=True)
df[df['Rank']==1]

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据日期比较删除行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >