我相信,而且从未见过其他证据。scikitlearn的IsolationForest文档引用了一篇论文Isolation-based Anomaly Detection by Liu et al.,其中等式2定义了异常分数。在本文中,异常分数在0到1之间,其中1是最异常的。在scores function中,您在第267行引用了变量深度。平均值(轴=1)对应于E(h(x))和平均路径长度(self.max_示例_))对应于纸中的c(psi)。因此,在第272行,当函数返回1减去分数时,我们得到[-0.5,0.5]的界限。在
在Scikit Learn的IsolationForest中,decision_函数返回的值范围为[-0.5,0.5],其中-.5是最不正常的。
我相信,而且从未见过其他证据。scikitlearn的IsolationForest文档引用了一篇论文Isolation-based Anomaly Detection by Liu et al.,其中等式2定义了异常分数。在本文中,异常分数在0到1之间,其中1是最异常的。在scores function中,您在第267行引用了变量深度。平均值(轴=1)对应于E(h(x))和平均路径长度(self.max_示例_))对应于纸中的c(psi)。因此,在第272行,当函数返回1减去分数时,我们得到[-0.5,0.5]的界限。在
编辑/奖金: 有效的隔离林预测方法是将决策函数值与存储在
model.threshold_
中的阈值进行比较。因此,在对某些数据调用模型的predict方法后,异常项是满足条件的相同项:model.decision_function(data) < model.threshold_
。在相关问题 更多 >
编程相关推荐