logistic回归sklearn和Stata的不同概率输出

X=list(zip(scLL, scLL2)) y=scLLchoice probStim2a=[] imputer = SimpleImputer(missing_values=float("nan"), strategy='mean') X_imputed = imputer.fit_transform(X) logistic_regression= LogisticRegression() logistic_regression.fit(X_imputed,y) y_pred=logistic_regression.predict(X_imputed) probStim2a=list(logistic_regression.predict_proba(X_imputed)[:,1]) for i in range(len(probStim2a)): print (probStim2a[i])

1条回答

网友

1楼 · 发布于 2024-09-28 23:37:07

好吧，可以说结果并没有什么不同；它们在质量上是相似的，这意味着两个实现之间的设置不同

在这种情况下，最可能的怀疑是sklearn的逻辑回归（LR）默认使用penalty='l2'参数（docs）；换句话说，sklearn的实现不是“普通的”LR，而是实际上RidgeLR。我不熟悉Stata（您也不发布相关代码），但从他们自己的documentation来看，这里似乎不是这样，因此结果不同

要获得相同的结果，请尝试删除sklearn中的L2惩罚，即：

logistic_regression= LogisticRegression(penalty='none')

关于statsmodels，它们有自己独特的默认值（即没有截距）；有关更多详细信息，请参阅交叉验证线程Logistic Regression: Scikit Learn vs Statsmodels

相关问题更多 >

编程相关推荐

热门问题

热门文章