我在python(2.7)中有一个pandas(v0.12)数据帧data
。我groupby()
相对于A
和{groups
类型的<class 'pandas.core.groupby.DataFrameGroupBy'>
对象。在
我想循环遍历并将函数应用于groups
中包含多行的数据帧。我的代码如下,这里的每个数据帧都是键、值对中的value
:
import pandas as pd
groups = data.groupby(['A','B'])
len(groups)
>> 196320 # too large - will be slow to iterate through all
for key, value in groups:
if len(value)>1:
print(value)
由于我只对将函数应用于len(value)>1
的值感兴趣,是否可以通过嵌入此条件来仅过滤和循环满足此条件的键值对来节省时间。我可以像下面这样做来确定每个value
的大小,但是我不确定如何将这个聚合与原始的groups
对象结合起来。在
我希望问题是清楚的,请让我知道如果需要澄清。在
您可以将组的长度指定回列并按其值进行筛选:
之后,您可以:
^{pr2}$如果是一次性操作,则跳过赋值:
相关问题 更多 >
编程相关推荐