Pandas：按一段线分组

6001 17/11/2019 6:00:00 PM 2019 ... 30.519371 NaN 6002 17/11/2019 6:00:00 PM 2019 ... 0.000000 NaN 6003 17/11/2019 6:00:00 PM 2019 ... 0.000000 NaN 6004 17/11/2019 6:00:00 PM 2019 ... 0.000000 NaN 6005 17/11/2019 6:00:00 PM 2019 ... 0.000000 NaN [6006 rows x 153 columns]>

In[9]: grouped_data Out[9]: PeriodStartDate Blast 1/09/2019 6:00:00 AM 6317.0 70.786625 7253.0 60.964185 8140.0 41.540451 1/09/2019 6:00:00 PM 6317.0 77.692637 7253.0 66.911911 8140.0 45.593178 1/10/2019 6:00:00 AM 2040.0 50.791661 2379.0 90.084856 5271.0 66.029160 1/10/2019 6:00:00 PM 2040.0 42.119914 2379.0 98.873622 5271.0 72.471029 1/11/2019 6:00:00 AM 2376.0 96.204423

2条回答

网友

1楼 · 编辑于 2024-09-27 21:22:39

您可以使用str属性：

grouped_data = data_drill.groupby([data_drill['PeriodStartDate'].str[:9], 'Blast'])
                                  ['Calc_DRILLING_Holes'].sum()

这假设索引将适用于所有日期

或者，将该列转换为datetime并使用data_drill['PeriodStartDate'].dt.date

网友

2楼 · 编辑于 2024-09-27 21:22:39

如果列是datetime类型，那么最好只删除时间戳，而只保留日期

df['PeriodStartDate'] = df['PeriodStartDate'].dt.date

然后你可以按日期分组

如果它不是datetime对象（如果您在分割它时遇到问题，那么我会怀疑它是），您可以通过转换它来实现这一点

pd.to_datetime(df.PeriodStartDate)

之后，对于排序，只需按分组后的日期排序即可

df.groupby(['PeriodStartDate', 'Blast'])['Calc_DRILLING_Holes'].sum().reset_index().sort_values('PeriodStartDate')

相关问题更多 >

编程相关推荐

热门问题

热门文章