海本频率

start_time start_station_name 2019-03-20 11:04:16 San Francisco Caltrain (Townsend St at 4th St) 2019-04-06 14:19:06 Folsom St at 9th St 2019-05-24 17:21:11 Golden Gate Ave at Hyde St 2019-03-27 18:53:27 4th St at Mission Bay Blvd S 2019-04-16 08:45:16 Esprit Park

start_time start_station_name April San Francisco Caltrain Station 2 (Townsend St at 4th St) 4866 Market St at 10th St 4609 San Francisco Ferry Building (Harry Bridges Plaza) 4270 Berry St at 4th St 3994 Montgomery St BART Station (Market St at 2nd St) 3550 ... September Mission Bay Kids Park 1026 11th St at Natoma St 1023 Victoria Manalo Draves Park 1018 Davis St at Jackson St 1015 San Francisco Caltrain Station (King St at 4th St) 1014

1条回答

网友

1楼 · 发布于 2024-09-21 00:22:39

尝试：

data = df.groupby([df['start_time'].dt.strftime('%B'), 'start_station_name']) \
        .count() \
        .rename(columns={"start_time": "count"}) \
        .reset_index()
ax = sns.countplot(x="start_time", hue="start_station_name", data=data[data.count > 1000])

解释：

我通过添加start_station_name列来更改groupby中的键
使用^{}获取单元格数
使用^{}将count列重命名为count
使用^{}从groupby重置索引
子集数据集
使用^{}绘制结果（使用文档中的第二个示例）

完整代码

print(df)
#            start_time                              start_station_name
# 0 2019-03-20 11:04:16  San Francisco Caltrain (Townsend St at 4th St)
# 1 2019-04-06 14:19:06                             Folsom St at 9th St
# 2 2019-05-24 17:21:11                      Golden Gate Ave at Hyde St
# 3 2019-03-27 18:53:27                    4th St at Mission Bay Blvd S
# 4 2019-04-16 08:45:16                                     Esprit Park

data = df.groupby([df['start_time'].dt.strftime('%B'), 'start_station_name']) \
        .count() \
        .rename(columns={"start_time": "count"}) \
        .reset_index()
print(data)
#   start_time                              start_station_name  count
# 0      April                                     Esprit Park      1
# 1      April                             Folsom St at 9th St      1
# 2      March                    4th St at Mission Bay Blvd S      1
# 3      March  San Francisco Caltrain (Townsend St at 4th St)      1
# 4        May                      Golden Gate Ave at Hyde St      1

# Filter as you desired
# data = data[data.count > 1000]

# Plot
ax = sns.countplot(x="start_time", hue="start_station_name", data=data)
plt.show()

输出

相关问题更多 >

编程相关推荐

热门问题

热门文章

海本频率

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >