我有一个带有
df.head()
(变量F1、F2和F3的级别分别为3、3和6),并运行代码
from patsy.contrasts import Sum
import statsmodels.formula.api as smf
model = 'SEL ~ C(F1, Sum) + C(F2, Sum) + C(F3, Sum)'
model = smf.logit(model, data=df)
model_fit = model.fit()
1)使用sklearn与上述内容的等效性是什么
2)使用sklearn,但在模型变量的第一个赋值中删除“Sum”,与上述操作的等效性是什么
您可以从提供onehot编码的内容开始,基本上删除最后一个级别,然后在与最后一个级别对应的行中插入-1:
现在,我们将此函数应用于所有列,连接和拟合:
让我们来描绘:
看看系数:
相关问题 更多 >
编程相关推荐