Python StatsModels Patsy解决方案,使用模型外参数进行预测

2024-05-18 17:42:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在对按年份细分的抵押贷款数据面板进行回归分析。所有的变量都是分类的虚拟变量。在某些年份,抵押贷款的某些特征或特征可能在其他年份不存在,因此我得到如下错误:

 PatsyError: Error converting data to categorical: observation with value 'Null/Invalid' does not match any of the expected levels (expected: ['Conventional', 'FHA', 'Other Non-Government Loan', 'VA'])
net_gnma_rate ~ C(origination_month) + C(Mortgage_FICO_Bins, Treatment("(720, 900]")) * C(Mortgage_LTV_Bins, Treatment("(0, 80]")) + C(alt_loantype, Treatment("Conventional")) + C(conforming_mtge, Treatment("conforming")) + C(alt_lien, Treatment("1st Lien")) + C(doctype, Treatment("Full Documentation")) + C(alt_occ, Treatment("Owner Occupied")) + C(altpmi3, Treatment("No PMI")) + C(units, Treatment("1 unit"))

有没有什么方法可以在StatsModels预测工具的构造中为不存在的变量插入一个β系数,最好是上一年的β系数。例如:

^{pr2}$

如果我对2012.predict(data2013)进行建模,则会出现一个错误,因为2013年C类贷款有观测值和回归因子,但2012年没有。然而,我想在使用2012年参数预测2013年数据时假设C类贷款的2011年贝塔系数。在

如何做到这一点?如有任何意见,我们将不胜感激。在


Tags: 数据面板错误特征alt细分expected年份

热门问题