评估高斯分布函数

2024-10-08 20:17:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我想知道如何确定高斯函数拟合我的数据。在

下面是一些我一直在测试方法的情节。目前,我使用的是fit与sample的RMSE(红色代表fit,蓝色代表sample)。在

例如,这里有两个很好的契合点:

Good Fit

enter image description here

这里有两个可怕的匹配应该标记为坏数据:

enter image description hereenter image description here

一般来说,我在寻找其他度量标准的建议来度量拟合优度。此外,正如您在第二个“良好”拟合中所看到的,有时在数据之外还有其他峰值。目前,RSME方法对这些问题进行了惩罚,但不应如此。在


Tags: 数据sample函数标记标准度量代表建议
3条回答

您可以使用stats中的probplot来尝试分位数(qq)图:

import pylab
from stats import probplot

plot = probplot(data, dist='norm', plot=pylab)
pylab.show()

Calculate quantiles for a probability plot, and optionally show the plot.

Generates a probability plot of sample data against the quantiles of a specified theoretical distribution (the normal distribution by default). probplot optionally calculates a best-fit line for the data and plots the results using Matplotlib or a given plot function.

有其他的方法来评估一个好的拟合,但大多数方法对异常值不具有鲁棒性。在

MSE-均方误差,你已经知道了,RMSE是它的根源。在

但是你也可以用MAE-平均绝对误差和{}-平均绝对百分比误差来测量它。在

另外,还有一个Kolmogorov-Smirnov测试,它要复杂得多,您可能需要一个库来完成,而MAEMAPE和{}可以很容易地实现自己。在

(如果您处理的是无监督数据和/或分类,这显然不是您的情况,ROC曲线和混淆矩阵也是精度指标。)

I'm looking for suggestions of additional metrics to measure the goodness of fit.

一个样本的Kolmogorov-Smirnov(KS)测试将是一个很好的起点。在

我建议用Wikipedia article作为介绍。在

该测试在SciPy中可用作^{}。函数计算并返回KS测试统计信息和p-value。在

相关问题 更多 >

    热门问题