Python2.7-statsmodels-格式化和编写摘要输出问题的回答

Python2.7-statsmodels-格式化和编写摘要输出

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我在Mac OSX Lion上使用<code>pandas 0.11.0</code>（数据处理）和<code>statsmodels 0.4.3</code>进行逻辑回归来进行实际的回归。 我将运行大约2900个不同的logistic回归模型，需要将结果输出到csv文件并以特定方式格式化。 目前，我只知道通过<code>print result.summary()</code>将结果（如下所示）打印到shell： <pre><code> Logit Regression Results ============================================================================== Dep. Variable: death_death No. Observations: 9752 Model: Logit Df Residuals: 9747 Method: MLE Df Model: 4 Date: Wed, 22 May 2013 Pseudo R-squ.: -0.02672 Time: 22:15:05 Log-Likelihood: -5806.9 converged: True LL-Null: -5655.8 LLR p-value: 1.000 =============================================================================== coef std err z P>|z| [95.0% Conf. Int.] ------------------------------------------------------------------------------- age_age5064 -0.1999 0.055 -3.619 0.000 -0.308 -0.092 age_age6574 -0.2553 0.053 -4.847 0.000 -0.359 -0.152 sex_female -0.2515 0.044 -5.765 0.000 -0.337 -0.166 stage_early -0.1838 0.041 -4.528 0.000 -0.263 -0.104 access -0.0102 0.001 -16.381 0.000 -0.011 -0.009 =============================================================================== </code></pre> 我还需要比值比，它由<code>print np.exp(result.params)</code>计算，并按如下方式打印在shell中： <pre><code>age_age5064 0.818842 age_age6574 0.774648 sex_female 0.777667 stage_early 0.832098 access 0.989859 dtype: float64 </code></pre> 我需要的是将它们以非常长的行的形式写入csv文件（目前还不确定我是否需要像<code>Log-Likelihood</code>这样的东西，但为了彻底起见，我已经包含了它）： <pre><code>`Log-Likelihood, age_age5064_coef, age_age5064_std_err, age_age5064_z, age_age5064_p>|z|,...age_age6574_coef, age_age6574_std_err, ......access_coef, access_std_err, ....age_age5064_odds_ratio, age_age6574_odds_ratio, ...sex_female_odds_ratio,.....access_odds_ratio` </code></pre> 我想你得到的图片-一个非常长的行，包含所有这些实际值，以及一个标题，其中包含类似格式的所有列名称。 我熟悉Python中的<code>csv module</code>，并且越来越熟悉<code>pandas</code>。不确定这些信息是否可以格式化并存储在<code>pandas dataframe</code>中，然后在所有~2900个逻辑回归模型完成后使用<code>to_csv</code>将其写入文件；这当然可以。另外，在每个模型完成时编写它们也很好（使用<code>csv module</code>）。 更新： 所以，我更关注statsmodels站点，特别是想弄清楚一个模型的结果是如何存储在类中的。似乎有一个名为“Results”的类需要使用。我认为使用这个类的继承来创建另一个类，其中一些方法/运算符可能会发生更改，以便获得所需的格式。我在这方面没有什么经验，需要花很多时间来解决这个问题（这很好）。如果有人能帮忙/有更多的经验那就太棒了！ 这里是类的布局位置：<a href="http://statsmodels.sourceforge.net/stable/dev/internal.html#model">statsmodels results class</a>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

Python2.7-statsmodels-格式化和编写摘要输出

1 个回答

相关Python问题