Python: 分组按小时包括空值

2024-09-28 01:26:15 发布

您现在位置:Python中文网/ 问答频道 /正文

使用citibike数据:https://s3.amazonaws.com/tripdata/index.html

tripduration    starttime   stoptime    start_station_id    start_station_name  start_station_latitude  start_station_longitude end_station_id  end_station_name    end_station_latitude    end_station_longitude   bikeid  usertype    birth_year  gender
461 2016-02-01 00:00:08 2016-02-01 00:07:49 480 W 53 St & 10 Ave    40.766697   -73.990617  524 W 43 St & 6 Ave 40.755273   -73.983169  23292   Subscriber  1966.0  1
297 2016-02-01 00:00:56 2016-02-01 00:05:53 463 9 Ave & W 16 St 40.742065   -74.004432  380 W 4 St & 7 Ave S    40.734011   -74.002939  15329   Subscriber  1977.0  1  
280 2016-02-01 00:01:00 2016-02-01 00:05:40 3134    3 Ave & E 62 St 40.763126   -73.965269  3141    1 Ave & E 68 St 40.765005   -73.958185  22927   Subscriber  1987.0  1

使用Groupby函数Groupby hour,我希望将空值包括为零。在

我使用了以下代码:

^{pr2}$

它返回按小时停放的自行车数量,但对于没有数据的小时,它会跳过。在

输出:

    end_station_name    stoptime               bikes_parked
0   1 Ave & E 15 St     2016-02-01 00:00:00    1
1   1 Ave & E 15 St     2016-02-01 05:00:00    1
2   1 Ave & E 15 St     2016-02-01 06:00:00    3

我想包括停车时间01,02,03,04,bikes_parked as 0以及。在


Tags: 数据nameidstartendsubscriberst小时
1条回答
网友
1楼 · 发布于 2024-09-28 01:26:15

如评论中所述,解决方案如下:

1)创建一个具有完整小时范围的数据帧,全部设置为bikes_parked=0

2)使用分组表中的相关数据更新此数据框,方法是:

df.loc[bikes_parked.index, 'bikes_parked'] = bikes_parked.bikes_parked

相关问题 更多 >

    热门问题