根据数据框中每个类别的特定值筛选数据框

df = url browser loadtime A safari 1500 A safari 1650 A Chrome 2800 B IE 3150 B safari 3300 C Chrome 2650 . . . . . .

def upper_outlier(x): return np.percentile(x, 75) + 3*(np.percentile(x,75)-np.percentile(x,25)) ## Find the upper outlier threshold per app df_grouped = df.groupby("app")['loadtime'].agg([('upper_outlier', lambda x : upper_outlier(x))])

1条回答

网友

1楼 · 发布于 2024-09-28 01:25:31

您可以尝试将计算与原始数据帧合并

df_grouped = df.groupby("app")['loadtime'].agg([('upper_outlier', lambda x : upper_outlier(x))]).reset_index()

dfmerged = df.merge(df_grouped, on = 'app', how = 'left')

然后过滤

dfmerged[dfmerged.loadtime<dfmerged.upper_outlier]

不确定这是否更有效，但似乎更直截了当

编程相关推荐

java如何使用Flyway回滚迁移？
sql试图在java中连接两个表，但我遇到了一个错误
java使用commons apache API复制文件内容
java无法解析模块
原因：java。lang.IllegalArgumentException:org。冬眠QueryException:无法解析属性：
java使用TNT4J，TrackingLogger统计数据仅显示该类的统计数据，如果我想要应用程序范围的统计数据呢？
java项目Euler#19，答案只有在1900年开始时才正确？
java显示标签上的选定值列表
java在局部变量中缓存属性吗？
java preparedStatement。setString（1，“null”）被解释为null而不是字符串（在preparedStatement.addBatch（）之后）

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据数据框中每个类别的特定值筛选数据框

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >