何时使用数据帧.eval（）与Pandas.eval（）或python eval（）

import pandas as pd import numpy as np import numexpr import timeit someDf = pd.DataFrame({'a':np.random.uniform(size=int(1e6)), 'b':np.random.uniform(size=int(1e6))}) %timeit -n100 someDf.eval("a**b - a*b > b**a - b/a") # DataFrame.eval() on notional expression %timeit -n100 eval("someDf['a']**someDf['b'] - someDf['a']*someDf['b'] > someDf['b']**someDf['a'] - someDf['b']/someDf['a']") %timeit -n100 pd.eval("someDf.a**someDf.b - someDf.a*someDf.b > someDf.b**someDf.a - someDf.b/someDf.a") 100 loops, best of 3: 29.9 ms per loop 100 loops, best of 3: 18.7 ms per loop 100 loops, best of 3: 15.4 ms per loop

1条回答

网友

1楼 · 发布于 2024-09-27 23:16:43

So is the benefit of DataFrame.eval() merely in simplifying the input, or can we identify circumstances where using this method is actually faster?

的source code数据帧.eval（）显示它实际上只是创建要传递给的参数pd.评估（）：

def eval(self, expr, inplace=None, **kwargs):

    inplace = validate_bool_kwarg(inplace, 'inplace')
    resolvers = kwargs.pop('resolvers', None)
    kwargs['level'] = kwargs.pop('level', 0) + 1
    if resolvers is None:
        index_resolvers = self._get_index_resolvers()
        resolvers = dict(self.iteritems()), index_resolvers
    if 'target' not in kwargs:
        kwargs['target'] = self
    kwargs['resolvers'] = kwargs.get('resolvers', ()) + tuple(resolvers)
    return _eval(expr, inplace=inplace, **kwargs)

其中，\u eval（）只是的别名pd.评估（）在模块开头导入：

^{pr2}$

所以你可以用df.eval()做任何事情，你都可以用pd.eval()+几行额外的行来设置。从目前的情况来看，df.eval()永远不会比pd.eval()快。但这并不意味着df.eval()和{}一样好，但写起来更方便。在

但是，在玩了%prun魔术之后，df.eval()对df._get_index_resolvers()的调用给df.eval()方法增加了相当多的时间。最终，_get_index_resolvers()最后调用了.copy()的.copy()方法，这是最终减慢速度的原因。同时，pd.eval()在某个时候确实调用了numpy.ndarray.copy()，但它花费的时间微不足道（至少在我的机器上）。在

长话短说，df.eval()似乎比pd.eval()慢，因为在引擎盖下，它只是pd.eval()加上额外的步骤，这些步骤是非常重要的。在

相关问题更多 >

编程相关推荐

热门问题

热门文章