吉布斯抽样线性回归
lrgs的Python项目详细描述
lrgs:gibbs抽样线性回归
代码实现吉布斯采样器处理多元线性回归问题,在所有测量量和内在散射的不确定性。详细信息可在this paper中找到,其摘要如下。(本文用r语言描述了一个实现,而这个包是python方法的一个端口。)
凯莉(2007,此后K07)描述了一种有效的算法,使用吉布斯抽样,在相当一般的情况下进行线性回归,其中对于协变量和响应变量都存在非零测量误差,其中这些测量可能与(相同的数据点)相关,其中响应变量受到影响。除了测量误差之外,本征散射和协方差的先验分布由高斯混合模型模拟,而不是假设是均匀的。这里我从两个方面扩展了k07算法。首先,将该过程推广到多响应变量的情况。其次,我描述了如何使用dirichlet过程来建模协变量的先验分布,这可以被认为是一个高斯混合,其中混合成分的数量是从数据中学习的。我提出了一个使用扩展算法进行多元回归的例子,即拟合动态松弛星系团的气体质量、温度和光度的标度关系,作为其质量和红移的函数。本文提供了一个用r语言实现的gibbs采样器,称为lrgs。
对于问题、评论、请求、问题等,请使用GitHub issues。
状态
python的lrgs目前在alpha中。它还没有被完全审查,而且r版本的一些特性也没有实现(参见VERSION.md)。
安装
自动
通过运行pip install lrgs从pypi安装。
手册
下载lrgs/lrgs.py并将其放在PYTHONPATH中的某个位置。您需要安装numpy和scipy软件包。
用法和帮助
在这一点上,文档是稀疏的,但是可以找到一个示例笔记本here。