在Python中,如何对每列的唯一值求和?

2024-09-28 17:06:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用的是网络日志,数据中包含帐户号和会话号。多个会话可以与一个帐户关联。我想创建一个新的数据框,其中包含帐户_id,并计算与该帐户关联的唯一会话数。我的测向图是这样的:

account_id session_id
 1111          de322
 1111          de322
 1111          de322
 1111          de323
 1111          de323
 0210          ge012
 0210          ge013
 0211          ge330
 0213          ge333

我用的是这个代码:

^{pr2}$

我得到的输出如下:

 account_id     sessions
 1111           de322
                de323
 0210           ge012 
                ge013 
 0211           ge330
 0213           ge333

我期望的输出

account_id   sessions
 1111           2
 0210           2  
 0211           1
 0213           1

我该怎么修?在


Tags: 数据代码idsession帐户accountsessions网络日志
1条回答
网友
1楼 · 发布于 2024-09-28 17:06:59
df = pd.DataFrame({'session': ['de322', 'de322', 'de322', 'de323', 'de323', 'ge012', 'ge012', 'ge013', 'ge333'],
                   'user_id': [1111, 1111, 1111, 1111, 1111, 210, 210, 210, 211],
                   })
print(df)


df = df.drop_duplicates().groupby('user_id').count()
print(df)

输出:

^{pr2}$

相关问题 更多 >