我需要运行很多OLS回归(~1.600)。我收集了大约1600个观测值的60个数据点。你知道吗
我使用的是Fama&French五因子模型,其中每个观测值的60个数据点与样本中的日期相匹配。例如,我在数据帧中有一个从开始日期['2010-1-1']到结束日期['2015-1-1']的五因素参数。你知道吗
我需要对给定股票的股票回报运行这些参数。现在,由于五因子参数是在一个数据帧中收集的,大约有96000行(1600*60)和五列(每个因子),我需要选择前60个观察值,用OLS对一组返回值运行它们,存储估计系数,然后为因子参数和股票收益选择下一个60个观察值。你知道吗
我试过使用切片,比如:
start = 0
stop = 59
empty_list = []
for i in my_data:
coef = my_date[i][start:stop]
# run regression with the coef slice and store them in a dataframe
start += 60
stop += 60
然而,我似乎无法让这个工作。如何解决这个问题有什么建议吗?你知道吗
使用
groupby
+np.arange() // 60
相关问题 更多 >
编程相关推荐