典型形式的概率分布
distcan的Python项目详细描述
python在其can中的概率分布 形式。文档(TOdo:link)
scipy.stats是用于概率工作的go-to库 python中的发行版。这是一个令人印象深刻的包,暴露了 内部一致的api,用于处理几乎100个发行版。 但是,也有一些缺点……
- 而不是对分布的参数使用公共名称 (如正态分布均值和标准差命名为mu 和sigma),scipy.stats有关键字参数(或 它们)loc、scale和shape承担了 规范参数
- 与非常规参数命名相关的文档 显示PDF的表达式,该表达式通常与 pdf的标准格式,可以很容易地在网上或标准中找到。 参考文献。这使得很难确切地知道什么样的分布 您正在与
- 有些分布包含在scipy.stats中,但是在 不同的名称PDF的不同文档形式。例如, 要创建一个inversegama(5,6)分布,您可以调用 scipy.stats.invgamma(5, scale=6)
输入distcan
distcan库旨在轻松地解决这些问题 可扩展的方式。这个项目的一些目标是
- 以其规范形式表示概率分布,其中 给定标准名称的参数
- 公开包含^{tt1}中功能的api$ 和 `Distributions.jl<;https://github.com/JuliaStats/Distributions.jl>;。`_ (一个julia包,它激发了distcan的创建) 两个软件包用户的命名约定一致
- 有准确描述分发的文档 使用
通过利用scipy.stats中的伟大代码,我们已经走上了成功的道路 为了完成这些目标。
功能
scipy.stats的所有功能,外加一些其他便利 方法,由每个分布公开。这包括以下内容 方法:
- pdf:计算概率密度函数
- logpdf:评估pdf的日志
- cdf:计算累积密度函数
- logcdf:计算cdf的日志
- rvs:从分布中随机抽取样本
- moment:计算第n个非中心力矩
- stats:rv的一些统计数据(如均值、方差、方差、方差等)。 偏度,峰度)
- {TT22}$(在SimP.STATS中可用时):返回最大值 给定数据分布的似然估计
- sf(也称为ccdf):计算生存函数(或 互补累积密度函数)
- logsf(也称为logccdf):计算生存日志 函数(或互补累积密度函数)
- isf:计算生存函数(或 互补累积密度函数)
- ppf(同时给出名称分位数):计算百分点函数 (或分位数),这是cdf的倒数。这是常用的 计算临界值。
- loglikelihood(不在scipy中): 关于x中所有样本的分布
- invlogcdf(不在scipy中):计算logcdf的逆函数
- cquantile(不在scipy中):计算互补分位数 功能。对于x in(0,1),等于d.ppf(1-x)。可以用来 计算分布的下临界值
- invlogccdf(不在scipy中):计算 logccdf
另外,每个发行版都有以下属性(访问 如dist_object.property_name-即不带括号:
- mean:分布的平均值
- var:分布的var
- std:分布的std
- skewness:分布的偏度
- kurtosis:分布的峰度小心
- median:分布的中值
- mode:分布模式
- isplaykurtic:布尔值,指示峰度是否大于零
- isleptokurtic:布尔值,指示峰度是否小于零
- ismesokurtic:布尔值,指示峰度是否等于零
- entropy:分布的熵
- params(不在scipy中):返回分布的元组 参数
贡献者
- 斯宾塞里昂(spencer.lyon@stern.nyu.edu)