如何在Pandas中执行groupby和选择unique？

UNIQUE_CARRIER_NAME MONTH_YEAR ROUTE 2512 ATA Airlines d/b/a ATA 2-1990 OGG-HNL 2648 ATA Airlines d/b/a ATA 2-1990 IND-RSW 2649 ATA Airlines d/b/a ATA 2-1990 IND-RSW 2650 ATA Airlines d/b/a ATA 2-1990 IND-RSW 3104 ATA Airlines d/b/a ATA 2-1990 HNL-SFO 3470 ATA Airlines d/b/a ATA 2-1990 SFO-HNL 3482 ATA Airlines d/b/a ATA 2-1990 SFO-OGG 4522 ATA Airlines d/b/a ATA 3-1990 OGG-HNL 5076 ATA Airlines d/b/a ATA 2-1990 RSW-IND 5077 ATA Airlines d/b/a ATA 2-1990 RSW-IND 5078 ATA Airlines d/b/a ATA 2-1990 RSW-IND 5296 ATA Airlines d/b/a ATA 3-1990 RSW-IND 5297 ATA Airlines d/b/a ATA 3-1990 RSW-IND 5371 ATA Airlines d/b/a ATA 3-1990 SFO-HNL 5389 ATA Airlines d/b/a ATA 3-1990 SFO-OGG ....

2条回答

网友

1楼 · 编辑于 2024-10-03 09:08:32

我认为您需要先^{}，然后再^{}您的函数（只需要一些示例函数，因为没有关于它的信息）：

def func(x):
    print (x)
    #apply your function 
    #some sample function 
    x['ROUTE'] = x['ROUTE'] + 'a'
    return x 

df = df.drop_duplicates(['UNIQUE_CARRIER_NAME','MONTH_YEAR','ROUTE'])
df = df.apply(func, axis=1)
print (df)
         UNIQUE_CARRIER_NAME MONTH_YEAR     ROUTE
2512  ATA Airlines d/b/a ATA     2-1990  OGG-HNLa
2648  ATA Airlines d/b/a ATA     2-1990  IND-RSWa
3104  ATA Airlines d/b/a ATA     2-1990  HNL-SFOa
3470  ATA Airlines d/b/a ATA     2-1990  SFO-HNLa
3482  ATA Airlines d/b/a ATA     2-1990  SFO-OGGa
4522  ATA Airlines d/b/a ATA     3-1990  OGG-HNLa
5076  ATA Airlines d/b/a ATA     2-1990  RSW-INDa
5296  ATA Airlines d/b/a ATA     3-1990  RSW-INDa
5371  ATA Airlines d/b/a ATA     3-1990  SFO-HNLa
5389  ATA Airlines d/b/a ATA     3-1990  SFO-OGGa

网友

2楼 · 编辑于 2024-10-03 09:08:32

不需要分组。只需使用以下方法删除数据帧中的副本：

df = df.drop_duplicates(subset=['UNIQUE_CARRIER_NAME','MONTH_YEAR','ROUTE'])

相关问题更多 >

编程相关推荐

热门问题

热门文章