为什么我用statsmodels做OLS和用scikit做PooledOLS得到相同的结果?

2024-09-25 08:29:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我现在正在用python做一个机器学习项目(这里是初学者,从头开始学习)

我只是想知道,使用我拥有的同一个面板数据集,statsmodels的OLS和scikit的PooledOlS有什么区别。我两个都试过了,结果都一样。这是否意味着他们基本上在做同一件事,但来自不同的软件包?我应该得到同样的结果吗?还是我做错了什么

我的数据集如下所示:

                  excessreturnlag1m      ROA  ...  momentum6m  momentum12m
bank  date                                    ...                         
bankA 2019-06-30         -14.564600   0.9795  ...        0.14        -0.24
      2019-05-31           7.522300   0.9795  ...       -0.69        -1.97
      2019-04-30          -2.020400   0.9795  ...        1.36        -1.70
bankB 2019-06-30          -5.969600   0.9915  ...       -0.39        -1.77
      2019-05-31           0.220200   0.9915  ...       -0.24        -2.00
      2019-04-30          -1.900000   0.9915  ...       -0.06        -1.42
bankC 2019-06-30           2.721700   0.9763  ...       -0.38        -1.13
      2019-05-31          -8.418900   0.9763  ...       -1.28        -1.19
      2019-04-30          -1.001100   0.9763  ...       -3.06        -1.16

我目前有一个多索引(银行和日期)在我的数据帧。我应该用它来做面板回归吗

编辑:据我所知,PooledOLS是多元线性回归的一个“特殊”例子,所以它会给出与statsmodels相同的结果?如果我错了就纠正我


Tags: 数据项目机器面板scikitbank初学者statsmodels
1条回答
网友
1楼 · 发布于 2024-09-25 08:29:30

OLS普通最小二乘法只是一种简单的计算方法
根据如何解正规方程,实现可能不同,但是测量执行时间可能是好的,因为计算量不同

相关问题 更多 >