我写了一个应该很快的lambda函数,但是这需要很长时间。有没有更好的方法来写这个?在
fn = lambda x: shape(df[df.CustomerCard_Num == x.CustomerCard_Num])[0]
df['tottrans'] = df.apply(fn, axis = 1)
基本上,我有一个很大的事务(行)数据库。一组行可能对应不同的客户(客户卡号如果df中的一列,多行可能具有相同的客户卡号码。)
我试图用这个lambda函数计算每个客户的行数。但似乎效果并不快。我应该使用groupby吗?在
Tags:
有一种内置方式:
参见docs
相关问题 更多 >
编程相关推荐