消除超过给定百分比的所有数据

2条回答

网友

1楼 · 编辑于 2024-09-30 14:16:57

使用^{}方法：

In [48]: cols = list('abc')

In [49]: df = DataFrame(randn(10, len(cols)), columns=cols)

In [50]: df.a.quantile(0.95)
Out[50]: 1.5776961953820687

要筛选出df行，其中df.a大于或等于第95个百分点do：

In [72]: df[df.a < df.a.quantile(.95)]
Out[72]:
       a      b      c
0 -1.044 -0.247 -1.149
2  0.395  0.591  0.764
3 -0.564 -2.059  0.232
4 -0.707 -0.736 -1.345
5  0.978 -0.099  0.521
6 -0.974  0.272 -0.649
7  1.228  0.619 -0.849
8 -0.170  0.458 -0.515
9  1.465  1.019  0.966

网友

2楼 · 编辑于 2024-09-30 14:16:57

在这类事情上，numpy比熊猫快得多：

numpy.percentile(df.a,95) # attention : the percentile is given in percent (5 = 5%)

相当于但比以下速度快3倍：

df.a.quantile(.95)  # as you already noticed here it is ".95" not "95"

所以对于你的代码，它给出了：

df[df.a < np.percentile(df.a,95)]

编程相关推荐

java如何在部署时启动EJB计时器？
java使用异步远程调用获取同步行为
java点击listview它必须去各自的活动吗？
java如何向Android应用程序添加新页面？
java如何发送和重新发送fxml对象
如果我在一个函数中更改一个变量的值，那么在Java的另一个函数中会使用更改后的值吗？
JavaFX中的java事件处理程序突然停止工作
使用触发器运行Java程序
从我的PC在服务器上运行Java应用程序
的Lambda表达式。NET在Java中的应用

相关问题更多 >

编程相关推荐

热门问题

热门文章

消除超过给定百分比的所有数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >