groupby函数的系列查询

2024-10-04 11:32:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个名为active的数据帧,它有10个唯一的POS列值。 enter image description hereThen我将POS值分组,并对OPW列进行平均规格化,然后将规格化值存储为一个单独的列['resid']enter image description hereIf I groupby on POS值不应该新活动数据帧的POS列只包含唯一的POS值??你知道吗

例如:

df2 = pd.DataFrame({'X' : ['B', 'B', 'A', 'A'], 'Y' : [1, 2, 3, 4]})
print df2

df2.groupby(['X']).sum()

我得到如下输出:

    Y
X   
A   7
B   3

在我的例子中,我不应该得到一个只有唯一Pos值的列吗??你知道吗

位置其他列
Rf值
2B值
低频值
2B值
价值观


Tags: 数据posdataframeifonactivepddf2
1条回答
网友
1楼 · 发布于 2024-10-04 11:32:29

如果没有实际的数据,我不能百分之百确定,但我很确定这里的问题是你没有聚合数据。你知道吗

让我们一步一步地通过分组。你知道吗

当您执行active.groupby('POS')操作时,实际发生的情况是,您正在按照每个唯一的位置对数据帧进行切片,并将这些sclice中的每一个顺序传递给应用的函数。你知道吗

您可以通过使用get\u group(例如:活动.groupby('POS')。获取\u组('RF'))

所以您将meanNormalizeOPW函数应用于这些片中的每一个。该函数为传递的数据帧的每一行创建列“resid”的平均标准化值。然后返回数据帧,以一个与传递的数据帧相似的形状结束。你知道吗

因此,如果您只是向返回的df添加一个聚合函数,它应该可以正常工作。我猜这里你想要一个平均值,所以只要把return df改成return df.mean()

相关问题 更多 >