Python如何在FORLOOP回归中计算和存储残差

import numpy as np import pandas as pd import matplotlib.pyplot as plt import pandas_datareader as pdr from sklearn.linear_model import LinearRegression from pandas.plotting import register_matplotlib_converters register_matplotlib_converters() import datetime tickers=['EXO.MI','LDO.MI'] end=datetime.date.today() gap=datetime.timedelta(days=650) start=end- gap Bank=pdr.get_data_yahoo(tickers,start=start,end=end) bank_matrix=Bank['Adj Close'] bank_matrix=bank_matrix.dropna() exor=bank_matrix['EXO.MI'] leonardo=bank_matrix['LDO.MI'] Regressione=pd.DataFrame(data=np.zeros((len(exor),3)),columns=['Intercetta','Hedge','Residuals'],index=bank_matrix['EXO.MI'].index) lookback=20 Hedge=[] Intercetta=[] Residuals=[] for i in range(lookback,len(exor)): reg=LinearRegression().fit(bank_matrix[['LDO.MI']][i-lookback+1:i],bank_matrix[['EXO.MI']][i-lookback+1:i]) # Regressione.iloc[Regressione[i,'Hedge']]=reg.coef_[0] Hedge.append(reg.coef_[0]) Intercetta.append(reg.intercept_) y_pred=reg.predict(bank_matrix[['LDO.MI']][lookback:]) Residuals.append(bank_matrix[['EXO.MI']][lookback:].to_numpy()-y_pred) Regressione=pd.DataFrame(list(zip(Intercetta,Hedge,Residuals)),columns=['Intercetta','Hedge','Residuals']) Regressione.set_index(bank_matrix[['EXO.MI']].index[lookback:],inplace=True)

1条回答

网友

1楼 · 发布于 2024-10-01 17:27:27

我仍然不完全清楚你想在这里做什么，但我希望这能让你有所收获。你知道吗

首先，如果只在开头添加import datetime，并用y_pred=reg.predict(bank_matrix[['LDO.MI']][lookback:]) Residuals.append(bank_matrix[['EXO.MI']][lookback:]-y_pred)替换y_pred=reg.predict(bank_matrix[['LDO.MI']][lookback:]) Residuals.append(bank_matrix[['EXO.MI']][lookback:].to_numpy()-y_pred)，那么代码运行良好。你知道吗

然后，您可以使用以下方法直观地检查每个子周期的残差：

for df in Residuals:
    df.plot.hist()

使用Residuals[-3:]将绘制计算的最后三个残差序列：

您还可以轻松地对每个残差序列运行Shapiro-Wilk正态性测试，并将结果附加到数据帧中：

from scipy import stats
shapiro=[]

for df in Residuals[-3:]:
    shapiro.append(stats.shapiro(df[df.columns[0]].values))

df_shapiro = pd.DataFrame(shapiro)

df_shapiro[0]返回W统计量，df_shapiro[1]返回p值。你知道吗

使用以下方法仔细查看p值：

df_pVal=df_shapiro[1].to_frame()
df_pVal['alpha']=0.05
df_pVal.plot()

有关如何使用测试的更多信息，请参阅here。你知道吗

问题仍然是你的目标是什么。详细的解释就好了。在那之前，我希望我的努力能让你更进一步。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章