有谁能帮我理解一下为什么要用下面两种方法来做,我想是什么,否则用熊猫.dataframegroupby方法,根据iPython的Magic%timeit,在不同的时间完成?在
%timeit somedf.groupby('someBoolColumn')['someBoolColumn'].count()
484 µs ± 9.52 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
%%timeit grp = somedf.groupby('someBoolColumn')
grp['someBoolColumn'].count()
146 µs ± 1.47 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
somedf有7200行和24列。在
我找不到
为什么首先将对象分配给变量grp的两个线性函数是>;3
速度更快,nor;
如果这只是特定于groupby方法或 比如,熊猫,甚至Python的一些更普遍的东西 变量分配。
非常感谢您的任何启示,因为这将真正帮助我处理许多更大的数据帧,重复使用许多不同的参数组合。在
Ipython的^{} docs 状态:
(我的重点)。
cell mode
是通过使用%%timeit
的双百分比形式触发的。 当您在IPython提示符处键入%magic
时,IPython在文档中也会打印出一个简介:因此
是计时
grp['someBoolColumn'].count()
,但不是赋值grp = somedf.groupby('someBoolColumn')
。在如何在没有设置行的情况下使用
%%timeit
:要使用
^{pr2}$%%timeit
对两个语句计时,只需将%%timeit
后的第一行留空:输入两次Enter即可完成单元格。在
相关问题 更多 >
编程相关推荐