计算用户的时间增量

session_id timestamp sess1 2018-11-05 14:28:25.260 sess2 2018-11-04 12:14:59.576 sess2 2018-11-04 11:55:00.584 sess2 2018-11-04 12:16:44.702 sess3 2018-11-04 12:04:37.419

2条回答

网友

1楼 · 编辑于 2024-09-30 02:36:05

可以将groupby与apply和减法max - min结合使用：

df1 = df.groupby('session_id').timestamp.apply(lambda x: x.max() - x.min()).reset_index()

df1.rename({'timestamp':'timeSpent'},axis=1,inplace=True)

print(df1)
  session_id       timeSpent
0      sess1        00:00:00
1      sess2 00:21:44.118000
2      sess3        00:00:00

以秒为单位：

df1 = df.groupby('session_id').timestamp.apply(lambda x: x.max() - x.min()).reset_index()
df1.rename({'timestamp':'timeSpent'},axis=1,inplace=True)
df1['timeSpent'] = df1['timeSpent'].dt.total_seconds()

print(df1)
  session_id  timeSpent
0      sess1      0.000
1      sess2   1304.118
2      sess3      0.000

网友

2楼 · 编辑于 2024-09-30 02:36:05

用途：

#convert column to datetimes if necessary
df['timestamp'] = pd.to_datetime(df['timestamp'])

#aggregate min and max
df1 = df.groupby('session_id')['timestamp'].agg(['min','max'])
#subtract to new column
df1['timeSpent'] = df1.pop('max') - df1.pop('min')
df1 = df1.reset_index()
print (df1)
  session_id       timeSpent
0      sess1        00:00:00
1      sess2 00:21:44.118000
2      sess3        00:00:00

具有^{}和元组的单行解决方案：

df1 = (df.groupby('session_id')['timestamp']
        .agg([('timeSpent', lambda x: x.max() - x.min())])
        .reset_index())
print (df1)
  session_id       timeSpent
0      sess1        00:00:00
1      sess2 00:21:44.118000
2      sess3        00:00:00

如果需要以秒为单位的输出，则按^{}转换时间增量：

df1['timeSpent'] = (df1.pop('max') - df1.pop('min')).dt.total_seconds()
df1 = df1.reset_index()
print (df1)
  session_id  timeSpent
0      sess1      0.000
1      sess2   1304.118
2      sess3      0.000

单行解决方案：

df1 = (df.groupby('session_id')['timestamp']
        .agg([('timeSpent', lambda x: x.max() - x.min())])
        .assign(timeSpent = lambda x: x['timeSpent'].dt.total_seconds())
        .reset_index())
print (df1)
  session_id  timeSpent
0      sess1      0.000
1      sess2   1304.118
2      sess3      0.000

相关问题更多 >

编程相关推荐

热门问题

热门文章

计算用户的时间增量

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >