Pandas groupbymedian函数用随机数填充空箱子

import pandas as pd d = pd.DataFrame([1,2,5,6,9,3,6,5,9,7,11,36,4,7,8,25,8,24,23]) b = [0,5,10,15,20,25,30,35,40,45,50,55] print d.groupby(pd.cut(d[0],b)).count() print d.groupby(pd.cut(d[0],b)).mean() print d.groupby(pd.cut(d[0],b)).median()

(0, 5] 3.333333 (5, 10] 7.500000 (10, 15] 11.000000 (15, 20] NaN (20, 25] 24.000000 (25, 30] NaN (30, 35] NaN (35, 40] 36.000000 (40, 45] NaN (45, 50] NaN (50, 55] NaN

(0, 5] 3.500000e+00 (5, 10] 7.500000e+00 (10, 15] 1.100000e+01 (15, 20] 1.800000e+01 (20, 25] 2.450000e+01 (25, 30] 3.050000e+01 (30, 35] 3.050000e+01 (35, 40] 3.600000e+01 (40, 45] 3.814316e+228 (45, 50] 3.814316e+228 (50, 55] 3.814316e+228

2条回答

网友

1楼 · 编辑于 2024-09-27 21:27:05

我敢肯定是个虫子：

考虑：

gb = d.groupby(pd.cut(d[0],b))

gb.median()

但是：

^{pr2}$

以及：

^{3}$

KeyError                                  Traceback (most recent call last)
<ipython-input-314-e1f4657d9a2d> in <module>()
  > 1 gb.get_group('(15, 20]').median()

/Users/me/anaconda/lib/python2.7/site-packages/pandas/core/groupby.pyc in get_group(self, name, obj)
    585         inds = self._get_index(name)
    586         if not len(inds):
 > 587             raise KeyError(name)
    588 
    589         return obj.take(inds, axis=self.axis, convert=False)

KeyError: '(15, 20]'

当组不存在时，它计算groupby对象上的median。在

网友

2楼 · 编辑于 2024-09-27 21:27:05

我将此问题报告为bug，并将其添加到0.19.0里程碑中：

https://github.com/pydata/pandas/issues/13629

相关问题更多 >

编程相关推荐

热门问题

热门文章