当钥匙数超过10k时,速度很慢,这是很常见的。有没有办法加快速度?在
import pandas as pd
n = 10*1000000
ngroup = 10000
m = n//ngroup
d = pd.DataFrame({"a":range(n), "b":list(range(ngroup))*m})
%timeit dagg = d.groupby("b")["a"].agg(["mean","std"]).reset_index()
#700 ms
#custom function
%timeit dagg = d.groupby("b")["a"].agg(lambda x: x.mean()+x.std()).reset_index()
#4.37 s
R的比较数据表在
^{pr2}$
如果只达到你所需要的(总和平均值和标准差),我认为在groupby之外做更有效
您的:
^{pr2}$相关问题 更多 >
编程相关推荐