我在这两个项目中都使用了logistic回归方法,想知道为什么我得到了不同的结果,尤其是在系数方面。结果,感染,是(1,0)和冲洗是一个连续变量。在
import statsmodels.api as sm
logit_model=sm.Logit(data['INFECTION'], data['Flushed'])
result=logit_model.fit()
print(result.summary())
结果:
^{pr2}$mylogit <- glm(INFECTION ~ Flushed, data = cvc, family = "binomial")
summary(mylogit)
结果:
Call:
glm(formula = INFECTION ~ Flushed, family = "binomial", data = cvc)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.0598 -0.3107 -0.2487 -0.2224 2.8051
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.91441 0.38639 -10.131 < 2e-16 ***
Flushed 0.22696 0.06049 3.752 0.000175 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
在Python逻辑模型中似乎缺少常量(offset)参数。在
要使用R的公式语法,需要拟合两个不同的模型:
要向Python模型添加常量,请使用
sm.add_constant(...)
。在相关问题 更多 >
编程相关推荐