大Pandas按不同因素分组和聚合

2024-10-03 02:32:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用python3和pandas

我有一个数据帧

tpfs.info()

     <class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 2121 entries, 2019-05-15 00:10:00 to 2019-05-31 23:52:00
Data columns (total 4 columns):
bg         2121 non-null int64
carbs      2121 non-null float64
humalog    2121 non-null float64
lantus     2121 non-null float64
dtypes: float64(3), int64(1)
memory usage: 162.9 KB

数据如下所示

                        bg  carbs   humalog lantus
time                
2019-05-30 08:36:00 150     0.0     0.0     0.0
2019-05-30 08:52:00 154     0.0     0.0     0.0
2019-05-30 09:00:00 158     0.0     0.0     0.0
2019-05-30 09:00:00 0       39.0    0.0     0.0
2019-05-30 09:00:00 0       0.0     2.5     0.0
2019-05-30 09:00:00 0       0.0     0.0     13.0
2019-05-30 09:07:00 161     0.0     0.0     0.0
2019-05-30 09:23:00 163     0.0     0.0     0.0
2019-05-30 09:36:00 160     0.0     0.0     0.0
2019-05-30 09:38:00 156     0.0     0.0     0.0

我想聚合数据,这样我就有了每24小时周期的行,显示bg的平均值以及carbs、humalog和lantus的总和

我尝试了groupby和agg的各种组合,得到了各种错误消息。底线是我只是从不同的源代码中剪切一个粘贴代码,并试图调整它们以适应我的用例,而没有完全理解它们是如何工作的

尽管有问题;一个例子,文件和我倾注了怎么办,我似乎找不到一个例子,接近什么,我试图做的应用。也许提取两个新的数据帧(一个用于bg平均值,一个用于求和),然后将它们组合起来

有什么想法吗


Tags: columns数据pandasnullpython3例子平均值bg