Pandas DataFram中的聚合行

2024-09-30 22:28:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我的pandas DataFrame包含以下列:

  1. VisitorID (unique for each user - cookie based)
  2. VisitNumber (1 = first visit, 2 = second visit and etc...)
  3. TimeSpentOnVist (visit duration in seconds)
  4. Channel (the referrer of the visit. ex: Facebook, Google and Bing )
  5. Media type (paid or organic)

每次访问(1、2、3)都会重复访客ID。我想把上次访问的时间汇总到频道和媒体类型,但同时,汇总(总结)所有访问所花费的时间。我的目标是按visitorID分组,这样就不会有重复。在

在大熊猫体内进行这种聚集最有效的方法是什么?在


Tags: andthedataframepandasforcookie时间visit
2条回答

Wen回答了聚合问题,但我还创建了一个MultiIndex来组织数据帧:

 df.set_index(['VisitorID','VisitNumber']).sort_index()

IIUC公司

df.sort_values(['VisitNumber']).groupby('VisitorID').\
     agg({'TimeSpentOnVist':'sum','Channel':'last','Media type':'last'})

相关问题 更多 >