如何在sklearn中禁用GLMs（泊松回归器）的正则化？

from scipy.optimize import minimize from sklearn._loss.glm_distribution import PoissonDistribution from sklearn.utils.optimize import _check_optimize_result from sklearn.linear_model._glm.link import LogLink alpha = 0 def _safe_lin_pred(X, coef): """Compute the linear predictor taking care if intercept is present.""" if coef.size == X.shape[1] + 1: return X @ coef[1:] + coef[0] else: return X @ coef def _y_pred_deviance_derivative(coef, X, y, family,link): """Compute y_pred and the derivative of the deviance w.r.t coef.""" lin_pred = _safe_lin_pred(X, coef) y_pred = link.inverse(lin_pred) d1 = link.inverse_derivative(lin_pred) temp = d1 * family.deviance_derivative(y, y_pred) if coef.size == X.shape[1] + 1: devp = np.concatenate(([temp.sum()], temp @ X)) else: devp = temp @ X # same as X.T @ temp return y_pred, devp # Same as PoissonRegressor, but with regularization removed. def func(coef, X, y,alpha,family,link): y_pred, devp = _y_pred_deviance_derivative( coef, X, y,family,link ) coef_scaled = alpha * coef dev = family.deviance(y, y_pred) obj = 0.5 * dev + 0.5 * (coef @ coef_scaled) objp = 0.5 * devp objp += coef_scaled return obj, objp args = (X, Y ,alpha,PoissonDistribution(),LogLink()) coef0 = np.ones(X.shape[1]) opt_res = minimize( func, coef0, method=method, jac=True, options={ "maxiter": self.max_iter, "iprint": (self.verbose > 0) - 1, "gtol": self.tol, "ftol": 1e3*np.finfo(float).eps, }, args=args)

2条回答

网友

1楼 · 编辑于 2024-10-04 01:37:21

尽管设置了alpha=0.0，但这并不能真正回答为什么要观察此正则化，但我的一个解决方法是使用GridSearchCV，因为它允许将此参数设置为0

网友

2楼 · 编辑于 2024-10-04 01:37:21

答案很简单：泊松回归器的默认公差为1E-4。将此项（增加所需的配合精度）更改为1E-5可纠正此问题

为什么我的代码和sklearn之间存在差异？sklearn目标函数最小化1/（2*n_样本）*和（偏差）。由于我有大量的样本，这种重新缩放改变了泊松回归函数的有效容差

相关问题更多 >

编程相关推荐

热门问题

热门文章