通过按分组计算数据帧中值的差异

station num_bikes Rush hour? num_racks hour Botanic 3 yes-am 9 9 Botanic 2 no 10 14 Botanic 10 no 2 20 Queens 6 no 10 5 Queens 10 yes-pm 6 18 Queens 12 yes-pm 4 19 Queens 1 no 15 7

1条回答

网友

1楼 · 发布于 2024-09-29 23:17:27

以下是我尝试过的，如果不合适请告诉我：

import pandas as pd
import numpy as np

df_filtered = pd.DataFrame([
    ('Botanic' ,  3      ,     'yes-am' ,    9    ,     9),
  ('Botanic'  , 2       ,    'no'        , 10     ,   14),
  ('Botanic'  , 10     ,     'no'        , 2      ,   20),
  ('Queens'   , 6     ,      'no'       ,  10     ,   5),
  ('Queens'   , 10   ,       'yes-pm'   ,  6      ,   18),
  ('Queens'   , 12  ,        'yes-pm'   ,  4      ,   19),
  ('Queens'   , 1  ,         'no'       ,  15     ,   7)
])

df_filtered.columns = ['station',   'num_bikes',   'Rush hour?', 'num_racks', 'hour']

df_filtered['diff'] = df_filtered['num_bikes'].diff().fillna(0)
df_filtered['arrivals'] = df_filtered['diff'][df_filtered['diff'] > 0]
df_filtered['departures'] = df_filtered['diff'][df_filtered['diff'] < 0]
df_filtered.drop(columns='diff', inplace=True)
df_filtered[['departures','arrivals']] = df_filtered[['departures','arrivals']].astype(float).fillna(0)
df_filtered.groupby(['Rush hour?', 'station'])[['arrivals','departures','num_bikes']].sum()

这些groupby结果可能不会保留输入数据帧的原始顺序，因此看起来可能很混乱，但这些是作为行组快照的到达/离开的净结果

相关问题更多 >

编程相关推荐

热门问题

热门文章

通过按分组计算数据帧中值的差异

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >