我有一个名为active
的数据帧,它有10个唯一的POS
列值。
Then我将POS
值分组,并对OPW列进行平均规格化,然后将规格化值存储为一个单独的列['resid']
。
If I groupby on POS
值不应该新活动数据帧的POS
列只包含唯一的POS
值??你知道吗
例如:
df2 = pd.DataFrame({'X' : ['B', 'B', 'A', 'A'], 'Y' : [1, 2, 3, 4]})
print df2
df2.groupby(['X']).sum()
我得到如下输出:
Y
X
A 7
B 3
在我的例子中,我不应该得到一个只有唯一Pos值的列吗??你知道吗
位置其他列
Rf值
2B值
低频值
2B值
价值观
如果没有实际的数据,我不能百分之百确定,但我很确定这里的问题是你没有聚合数据。你知道吗
让我们一步一步地通过分组。你知道吗
当您执行
active.groupby('POS')
操作时,实际发生的情况是,您正在按照每个唯一的位置对数据帧进行切片,并将这些sclice中的每一个顺序传递给应用的函数。你知道吗您可以通过使用get\u group(例如:活动.groupby('POS')。获取\u组('RF'))
所以您将
meanNormalizeOPW
函数应用于这些片中的每一个。该函数为传递的数据帧的每一行创建列“resid”的平均标准化值。然后返回数据帧,以一个与传递的数据帧相似的形状结束。你知道吗因此,如果您只是向返回的df添加一个聚合函数,它应该可以正常工作。我猜这里你想要一个平均值,所以只要把
return df
改成return df.mean()
相关问题 更多 >
编程相关推荐