Python pandas基于每个inpu不同的另一列进行排名/排序

2024-09-29 21:51:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我想在前三个专栏的基础上提出以下第四个专栏:

user    job  time  Rank
A   print   1559   2
A   print   1540   2
A   edit    1520   1
A   edit    1523   1
A   deliver 9717   3
B   edit    1717   2
B   edit    1716   2
B   edit    1715   2
B   deliver 1527   1
B   deliver 1524   1

第4列中的排名对每个用户是独立的(第1列)。对于每个用户,我想根据第三列的值对第二列进行排名。对于用户A,他/她有三个工作要做。因为“edit”的时间值最小,edit次之,deliver最大,所以这三个时间值的排名是edit-1、print-2和deliver-3。在

我知道我应该从groupby的第一列开始,但是不知怎么地,我无法根据第三列对第二列进行排序,因为第三列每行都不同。在


Tags: 用户time排序时间jobedit基础print
2条回答

首先,分配一个新列,该列包含用户作业对的最短时间:

df['min_time'] = df.groupby(['user', 'job'])['time'].transform('min')

然后按每个用户分组并对其进行排名:

^{pr2}$

或者你可以用

df1=df1.sort_values(['user','time'],ascending=[True,True])
df1['Rank']=df1.job!=df1.job.shift().fillna('edit')
df1.Rank=df1.groupby('user').Rank.cumsum()+1


  user      job  time  Rank
0    A    print  1559   2.0
1    A    print  1540   2.0
2    A     edit  1520   1.0
3    A     edit  1523   1.0
4    A  deliver  9717   3.0
5    B     edit  1717   2.0
6    B     edit  1716   2.0
7    B     edit  1715   2.0
8    B  deliver  1527   1.0
9    B  deliver  1524   1.0

相关问题 更多 >

    热门问题