如何在Python中计算学生化的残差？

网友

1楼 · 编辑于 2024-10-08 19:22:40

Nodar的实现是不正确的，这里是来自https://newonlinecourses.science.psu.edu/stat501/node/339/的修正公式以及删除的studentized残差，以防人们不想使用statsmodels包。两个公式返回的结果与上面链接中的示例相同

def internally_studentized_residual(X,Y):
    X = np.array(X, dtype=float)
    Y = np.array(Y, dtype=float)
    mean_X = np.mean(X)
    mean_Y = np.mean(Y)
    n = len(X)
    diff_mean_sqr = np.dot((X - mean_X), (X - mean_X))
    beta1 = np.dot((X - mean_X), (Y - mean_Y)) / diff_mean_sqr
    beta0 = mean_Y - beta1 * mean_X
    y_hat = beta0 + beta1 * X
    residuals = Y - y_hat
    h_ii = (X - mean_X) ** 2 / diff_mean_sqr + (1 / n)
    Var_e = math.sqrt(sum((Y - y_hat) ** 2)/(n-2))
    SE_regression = Var_e*((1-h_ii) ** 0.5)
    studentized_residuals = residuals/SE_regression
    return studentized_residuals

def deleted_studentized_residual(X,Y):
    #formula from https://newonlinecourses.science.psu.edu/stat501/node/401/
    r = internally_studentized_residual(X,Y)
    n = len(r)
    return [r_i*math.sqrt((n-2-1)/(n-2-r_i**2)) for r_i in r]

网友

2楼 · 编辑于 2024-10-08 19:22:40

我在处理同样的问题。解决方案是使用statsmodels库：

from statsmodels.stats.outliers_influence import OLSInfluence

它包含一个resid_studentized_internal方法。在

网友

3楼 · 编辑于 2024-10-08 19:22:40

对于简单的线性回归，可以使用以下方法计算学生化残差

将X和Y的平均值定义为：

mean_X = sum(X) / len(X) 
mean_Y = sum(Y) / len(Y)

现在你要估计系数β0和β1

^{2}$

现在，您需要通过使用

y_hat = [beta0 + beta1*X[i] for i in range(len(X))]

现在计算残差，也就是Y-Y\u

residuals = [Y[i] - y_hat[i] for i in range(len(Y))]

我们需要找到H矩阵，它是其中X是自变量的矩阵。在

为了找到杠杆作用，我们必须采用H矩阵的对角线元素，如下所示：

leverage = numpy.diagonal(H)

如果回归为

Var_e = sum([(Y[i] - y_hat[i])**2 for i in range(len(Y)) ]) / (len(Y) -2)
SE_regression = math.sqrt(Var_e*[(1-leverage[i]) for i in range len(leverage)])

现在你可以计算学生化的残差

studentized_residuals = [residuals[i]/SE_regression for i in range(len(residuals))]

注意，我们有两种类型的学生化残差。一个是内部学生化残差第二个是外部学生化残差

我的解决方案是找到内部学习的残差。在

我修正了我的计算。对于外部研究的残差，请参考@kkawabat的答案

相关问题更多 >

编程相关推荐

热门问题

热门文章