Patsy公式中的多个分类变量

2024-06-26 00:04:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一些数据,有多个分类元素

我想用回归法对它们进行建模,使用patsy公式与statsmodels一起使用,以方便使用

当只使用一个分类变量时,如公式'C(Weekday, Treatment) - 1'中所示,它会按预期工作,删除截距,并在每个类别的设计矩阵中留下一列

然而,当使用两个不同的分类变量时,比如'C(Status, Treatment) + C(Weekday, Treatment) - 1',那么结果矩阵确实没有截距,但是“Weekday”的一个值也丢失了,就好像我没有-1

是否有一些统计上的原因我没有看到?删除截距不足以阻止完美共线吗? 谢谢


Tags: 数据元素status分类原因矩阵建模类别