使用pandas和statsmodels时提取变量名

2024-10-04 05:27:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从statsmodels生成的结果中访问变量的名称。我将在示例代码之后详细说明。在

import scikits.statsmodels.api as sm
import pandas as pd
data = sm.datasets.longley.load()
df = pd.DataFrame(data.exog, columns=data.exog_name)
y = data.endog
df['intercept'] = 1.
olsresult = sm.OLS(y, df).fit()

此摘要输出包括变量名。当你打电话给olsresult.params它返回以下值:

^{pr2}$

现在我想做的是创建一个类似字典的东西,变量名作为键,参数值作为值。比如{'GNPDELF':15.0618, 'GNP':-0.035819}等等。如果不可能做到这一点,是否有其他方法单独访问变量名和值?在


Tags: 代码import名称api示例pandasdfdata
2条回答

总是值得一试的。。:^)

In [14]: olsresult.params
Out[14]: 
GNPDEFL           15.061872
GNP               -0.035819
UNEMP             -2.020230
ARMED             -1.033227
POP               -0.051104
YEAR            1829.151465
intercept   -3482258.634597

In [15]: dict(olsresult.params)
Out[15]: 
{'ARMED': -1.0332268671737328,
 'GNP': -0.035819179292614578,
 'GNPDEFL': 15.061872271452557,
 'POP': -0.051104105653539733,
 'UNEMP': -2.0202298038172479,
 'YEAR': 1829.151464613984,
 'intercept': -3482258.6345966831}

另请参见Series对象的.to_dict()方法。在

olsresult.params是一个熊猫系列对象可能不需要转换为dict

In [12]: olsresult.params.get('GNP')
Out[12]: -0.035819179292566283

In [13]: olsresult.params['GNP']
Out[13]: -0.035819179292566283

In [14]: for key, value in olsresult.params.iteritems():
   ....:     print key, value
   ....:
GNPDEFL 15.0618722714
GNP -0.0358191792926
UNEMP -2.02022980382
ARMED -1.03322686717
POP -0.0511041056537
YEAR 1829.15146461
intercept -3482258.6346

相关问题 更多 >