从pandas DataFrame创建一个布尔列，其中True表示在列中存在字符串。

client_id opp_id opportunity_status 4312 80465 Closed Won 4312 34508 Closed Won 4312 56478 Pending 3456 29930 Closed Lost 3456 70331 Pending 3456 65203 Closed Won 5203 29930 Closed Lost 5203 70331 Pending 5203 65203 Closed Lost 5203 65203 Closed Lost

1条回答

网友

1楼 · 发布于 2024-05-18 21:42:02

您可以使用groupby.agg，为每个客户机id检查机会状态是否等于已关闭赢的：

df.groupby('client_id', as_index=False).opportunity_status.agg(lambda x: x.eq('Closed Won').any())

# client_id   opportunity_status
#0     3456                 True
#1     4312                 True
#2     5203                False

或更快的版本：

df.opportunity_status.eq('Closed Won').groupby(df.client_id).any().reset_index()

#   client_id   opportunity_status
#0       3456                True
#1       4312                True
#2       5203               False

%timeit df.groupby('client_id', as_index=False).opportunity_status.agg(lambda x: x.eq('Closed Won').any())
# 100 loops, best of 3: 4.84 ms per loop

%timeit df.opportunity_status.eq('Closed Won').groupby(df.client_id).any().reset_index()
# 1000 loops, best of 3: 2.06 ms per loop

相关问题更多 >

编程相关推荐

热门问题

热门文章

从pandas DataFrame创建一个布尔列，其中True表示在列中存在字符串。

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >