返回时间段之间的绝对差值

Report month ID Vendedor sum count Rental Charge 2018-07-01 803621.0 780.81 42 4 2018-07-01 900000.0 100.90 20 5 2018-08-01 803621.0 1132.71 77 3 2018-08-01 900000.0 1000.10 10 2

Report month ID Vendedor sum count Rental Charge Diff 2018-07-01 803621.0 780.81 42 4 0 2018-08-01 803621.0 1132.71 77 3 351.90 2018-07-01 900000.0 100.90 20 5 0 2018-08-01 900000.0 1000.10 10 2 899.20

Report month ID Vendedor sum count Rental Charge Pct_change 2018-07-01 803621.0 780.81 42 4 NaN 2018-08-01 803621.0 1132.71 77 3 NaN 2018-07-01 900000.0 100.90 20 5 NaN 2018-08-01 900000.0 1000.10 10 2 NaN

3条回答

网友

1楼 · 编辑于 2024-04-23 09:01:29

将^{}与^{}一起使用：

#if necessary
#one = one.sort_values('Report month')
one['diff'] = one.groupby('ID Vendedor')['sum'].diff().fillna(0)
one = one.sort_values('ID Vendedor')
print (one)
  Report month  ID Vendedor      sum  count  Rental Charge   diff
0   2018-07-01     803621.0   780.81     42              4    0.0
2   2018-08-01     803621.0  1132.71     77              3  351.9
1   2018-07-01     900000.0   100.90     20              5    0.0
3   2018-08-01     900000.0  1000.10     10              2  899.2

网友

2楼 · 编辑于 2024-04-23 09:01:29

使用^{} 要对数据帧进行排序，然后我们可以使用^{}和^{}来创建Diff列：

new_df = (df.sort_values(['ID Vendedor','Report month'])
            .assign(Diff = lambda x: x.groupby('ID Vendedor')['sum']
                                       .diff().fillna(0))
         )
print(new_df)
  Report month  ID Vendedor      sum  count  Rental Charge   Diff
0   2018-07-01     803621.0   780.81     42              4    0.0
2   2018-08-01     803621.0  1132.71     77              3  351.9
1   2018-07-01     900000.0   100.90     20              5    0.0
3   2018-08-01     900000.0  1000.10     10              2  899.2

我们也可以使用^{}和^{}

(df.sort_values(['ID Vendedor','Report month'])
   .assign(Diff = lambda x: x['sum'].sub(x.groupby('ID Vendedor')['sum']
                                          .shift())
                                    .fillna(0)))

网友

3楼 · 编辑于 2024-04-23 09:01:29

在对数据帧进行排序后，可以使用diff执行此操作：

# Sort
df = df.sort_values(by=['ID Vendedor', 'Report month'])

# Compute diff
df['Diff'] = df['sum'].diff()

# Set to 0 when vendor changes
mask = df['ID Vendedor'] != df['ID Vendedor'].shift(1)
df.loc[mask, 'Diff'] = 0

# Sort again?
df = df.sort_values(by='Report month')

相关问题更多 >

编程相关推荐

热门问题

热门文章