我现在正在用python做一个机器学习项目(这里是初学者,从头开始学习)
我只是想知道,使用我拥有的同一个面板数据集,statsmodels的OLS和scikit的PooledOlS有什么区别。我两个都试过了,结果都一样。这是否意味着他们基本上在做同一件事,但来自不同的软件包?我应该得到同样的结果吗?还是我做错了什么
我的数据集如下所示:
excessreturnlag1m ROA ... momentum6m momentum12m
bank date ...
bankA 2019-06-30 -14.564600 0.9795 ... 0.14 -0.24
2019-05-31 7.522300 0.9795 ... -0.69 -1.97
2019-04-30 -2.020400 0.9795 ... 1.36 -1.70
bankB 2019-06-30 -5.969600 0.9915 ... -0.39 -1.77
2019-05-31 0.220200 0.9915 ... -0.24 -2.00
2019-04-30 -1.900000 0.9915 ... -0.06 -1.42
bankC 2019-06-30 2.721700 0.9763 ... -0.38 -1.13
2019-05-31 -8.418900 0.9763 ... -1.28 -1.19
2019-04-30 -1.001100 0.9763 ... -3.06 -1.16
我目前有一个多索引(银行和日期)在我的数据帧。我应该用它来做面板回归吗
编辑:据我所知,PooledOLS是多元线性回归的一个“特殊”例子,所以它会给出与statsmodels相同的结果?如果我错了就纠正我
OLS:普通最小二乘法只是一种简单的计算方法
根据如何解正规方程,实现可能不同,但是测量执行时间可能是好的,因为计算量不同
相关问题 更多 >
编程相关推荐