我已经聚合了一些数据,我想将聚合值返回到另一个数据帧中。我把数据汇总成这样
bycluster_type = df.groupby(['cluster', 'Type'])
tCount = bycluster_type['Type'].agg([len])
编辑:从这一点上讲,我犯了一些错误,现在我已经改正了,并添加了一些新的想法。
tCount现在是一个具有多索引的数据帧。我现在要做的是得到集群,类型和相应的值,将其与另一个数据帧中的一些其他数据放在一起。例如:
>>> tCount
len
cluster Type
1.0 M 1
2.0 M 7
4.0 M 2
所以下一步是获取索引和行:
index, row = next(tCount.index.values)
所以我接下来要做的是将索引元组解压到集群中,然后键入并从行中获取len值。你知道吗
cluster, type = index
val = row['len']
有没有更有效或更优雅的方法来实现我的目标?你知道吗
编辑:一些示例数据
cluster, Type, foo
1, M, f
1, T, o
1, S, o
2, M, f
2, M, o
3, T, o
运行代码并发现tCount会导致多索引数据帧。你知道吗
您不需要遍历索引,
df = tCount.reset_index()
应该可以做到这一点。你知道吗相关问题 更多 >
编程相关推荐