Python中文
首页
教程
问答
标签
搜索
登录
注册
Python2.7-statsmodels-格式化和编写摘要输出
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我在Mac OSX Lion上使用<code>pandas 0.11.0</code>(数据处理)和<code>statsmodels 0.4.3</code>进行逻辑回归来进行实际的回归。</p> <p>我将运行大约2900个不同的logistic回归模型,需要将结果输出到csv文件并以特定方式格式化。</p> <p>目前,我只知道通过<code>print result.summary()</code>将结果(如下所示)打印到shell:</p> <pre><code> Logit Regression Results ============================================================================== Dep. Variable: death_death No. Observations: 9752 Model: Logit Df Residuals: 9747 Method: MLE Df Model: 4 Date: Wed, 22 May 2013 Pseudo R-squ.: -0.02672 Time: 22:15:05 Log-Likelihood: -5806.9 converged: True LL-Null: -5655.8 LLR p-value: 1.000 =============================================================================== coef std err z P>|z| [95.0% Conf. Int.] ------------------------------------------------------------------------------- age_age5064 -0.1999 0.055 -3.619 0.000 -0.308 -0.092 age_age6574 -0.2553 0.053 -4.847 0.000 -0.359 -0.152 sex_female -0.2515 0.044 -5.765 0.000 -0.337 -0.166 stage_early -0.1838 0.041 -4.528 0.000 -0.263 -0.104 access -0.0102 0.001 -16.381 0.000 -0.011 -0.009 =============================================================================== </code></pre> <p>我还需要比值比,它由<code>print np.exp(result.params)</code>计算,并按如下方式打印在shell中:</p> <pre><code>age_age5064 0.818842 age_age6574 0.774648 sex_female 0.777667 stage_early 0.832098 access 0.989859 dtype: float64 </code></pre> <p>我需要的是将它们以非常长的行的形式写入csv文件(目前还不确定我是否需要像<code>Log-Likelihood</code>这样的东西,但为了彻底起见,我已经包含了它):</p> <pre><code>`Log-Likelihood, age_age5064_coef, age_age5064_std_err, age_age5064_z, age_age5064_p>|z|,...age_age6574_coef, age_age6574_std_err, ......access_coef, access_std_err, ....age_age5064_odds_ratio, age_age6574_odds_ratio, ...sex_female_odds_ratio,.....access_odds_ratio` </code></pre> <p>我想你得到的图片-一个非常长的行,包含所有这些实际值,以及一个标题,其中包含类似格式的所有列名称。</p> <p>我熟悉Python中的<code>csv module</code>,并且越来越熟悉<code>pandas</code>。不确定这些信息是否可以格式化并存储在<code>pandas dataframe</code>中,然后在所有~2900个逻辑回归模型完成后使用<code>to_csv</code>将其写入文件;这当然可以。另外,在每个模型完成时编写它们也很好(使用<code>csv module</code>)。</p> <p>更新:</p> <p>所以,我更关注statsmodels站点,特别是想弄清楚一个模型的结果是如何存储在类中的。似乎有一个名为“Results”的类需要使用。我认为使用这个类的继承来创建另一个类,其中一些方法/运算符可能会发生更改,以便获得所需的格式。我在这方面没有什么经验,需要花很多时间来解决这个问题(这很好)。如果有人能帮忙/有更多的经验那就太棒了!</p> <p>这里是类的布局位置:<a href="http://statsmodels.sourceforge.net/stable/dev/internal.html#model">statsmodels results class</a></p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<ul> <li>results.params:系数</li> <li>results.p values:对于p值</li> </ul> <p>顺便说一下,您可以使用dir(results)查找对象的所有属性</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
我想从用户inpu创建一个类的实例
2 回答
我想从用户导入值,为此
1 回答
我想从用户那里得到一个整数输入,然后让for循环遍历该数字,然后调用一个函数多次
7 回答
我想从用户那里收到一个列表,并在其中执行一些步骤,然后在步骤完成后将其打印回来,但它没有按照我想要的方式工作
10 回答
我想从用户那里获取输入,并将值传递给(average=dict[x]/6),然后在那里获取resu
10 回答
我想从第一个列表中展示第一个词,然后从第二个列表中展示十个词,以此类推- Python
10 回答
我想从第一个空lin开始解析文本文件
2 回答
我想从简历、简历中提取特定部分
9 回答
我想从给定字典(python)的字符串中删除\u00a9、\u201d和类似的字符。
7 回答
我想从给定的网站Lin下载许多文件扩展名相同的Wget或Python文件
6 回答
我想从网上搜集一些关于抵押贷款的数据
1 回答
我想从网站上删除电子邮件地址
5 回答
我想从网站上读取数据该网站包含可下载的文件,然后我想用python脚本把它发送给oracle如何?
1 回答
我想从网站中提取数据,然后将其显示在我的网页上
7 回答
我想从网页上提取统计数据。
3 回答
我想从网页上解析首都城市,并在用户输入国家时在终端上打印它们
10 回答
我想从色彩图中删除前n个颜色,而不丢失原始颜色数
10 回答
我想从课堂上打印字典里的键
4 回答
我想从费用表中获取学生上次支付的费用,其中学生id=id
10 回答
我想从较低的顺序对多重列表进行排序,但我无法在一行中生成结果
6 回答