计算pandas datafram中包含特定字符串的行的平均/标准差

2024-05-04 00:46:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个大熊猫数据帧,读作table。我想计算两个不同组的平均值和标准差,CRPS和{},这样我就可以用标准偏差作为误差条来绘制它们。在

我可以通过Age列得到平均值。我认为这是一个for循环,我必须构造它,但是我不知道如何构造比table["Age"].mean()更远的循环,它只给出了所有数据点的年龄值的平均值。这就是我需要一些指导的地方。我想查看组列,告诉它计算该组年龄的平均值和标准差。{/cd2>的平均值

下面是前25行,只是为了显示数据帧的样子。我还导入了numpy as np。在

        Group  Age
0       CRPS   50
1       CRPS   59
2       CRPS   22
3       CRPS   48
4       CRPS   53
5       CRPS   48
6       CRPS   29
7       CRPS   44
8       CRPS   28
9       CRPS   42
10      CRPS   35
11  CONTROLS   54
12  CONTROLS   43
13      CRPS   50
14      CRPS   62
15  CONTROLS   64
16  CONTROLS   39
17      CRPS   40
18      CRPS   59
19      CRPS   46
20  CONTROLS   56
21      CRPS   21
22      CRPS   45
23  CONTROLS   41
24      CRPS   46
25  CONTROLS   35

Tags: 数据foragetable绘制mean误差平均值
1条回答
网友
1楼 · 发布于 2024-05-04 00:46:00

我不认为你需要一个for循环。在

相反,您可以尝试类似于:

table.iloc[table['Group'] == 'CRPS']['Age'].mean()

我还没有用你的桌子测试过,但我想那会有用的。在

其思想是首先创建一个布尔数组,这对于group字段包含'CRPS'的行索引是正确的,然后使用iloc选择所有这些行,最后取平均值。可以按以下方式迭代所有组:

^{pr2}$

也许这就是你打算使用for循环的地方。在

相关问题 更多 >