Python Groupby转换多个参数

Casenumber Site CreatedDate NewValue 1 A 2018-03-30 16:47:03 Approved 2 A 2018-04-02 19:24:43 Assigned 2 A 2018-04-02 25:24:43 Delayed 2 A 2018-04-02 20:49:45 Approved 2 B 2018-04-02 19:24:43 Assigned 2 B 2018-04-02 22:49:45 Approved 2 B 2018-04-02 25:24:43 Delayed

Casenumber Site CreatedDate NewValue Diff 1 A 2018-03-30 16:47:03 Approved N/A 2 A 2018-04-02 19:24:43 Assigned 0 days 0 hours 2 A 2018-04-02 20:49:45 Approved 0 days 1:25:02 2 A 2018-04-02 25:24:43 Delayed N/A 2 B 2018-04-02 19:24:43 Assigned 0 days 0 hours 2 B 2018-04-02 22:49:45 Approved 0 days 3:25:02 2 B 2018-04-02 25:24:43 Delayed N/A

2条回答

网友

1楼 · 编辑于 2024-10-01 00:23:48

最后，我使用了透视表格式。从具有多索引的数据透视开始。你知道吗

restrdata = pd.pivot_table(restrdata, index =['Casenumber','OldValue','Site'], columns = 'NewValue', values = 'CreatedDate', aggfunc = 'first')

然后我开始创建子pivot表，其中包含任何Casenumber，这些Casenumber对于我要查找的响应没有空值。你知道吗

AAdata = restrdata[(~restrdata['Approved: Admin Excep'].isnull()).groupby(['Casenumber']).transform('any')]

最后，执行一个计算，只得到批准的时间和分配的时间之间的差异。你知道吗

AAdiff = (AAdata[~AAdata['Approved'].isnull()].reset_index(level=1)['Approved']
 - AAdata[~AAdata['Assigned'].isnull()].reset_index(level=1)['Assigned'])

网友

2楼 · 编辑于 2024-10-01 00:23:48

首先确保“CreatedDate”列是datetime：

df['CreatedDate'] = pd.to_datetime(df['CreatedDate'])

那么这应该管用。你知道吗

df['diff'] = df.sort_values(['Casenumber', 'Site']).groupby(['Casenumber', 'Site'])['CreatedDate'].diff()

查看其他可能有用的帖子。 How to calculate time difference by group using pandas?

相关问题更多 >

编程相关推荐

热门问题

热门文章