Python(或R)中连续分布的总变化距离

2024-09-28 13:13:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我想计算两个连续概率分布之间的总变异距离(TVD)。我想指出,虽然有两个相关的问题(见herehere),但它们都适用于离散分布

对于那些不熟悉电视的人来说

Informally, this is the largest possible difference between the probabilities that the two probability distributions can assign to the same event.

如各Wikipedia page中所述。在连续分布的情况下,TVD等于两者之间绝对差的一半积分(因为我无法添加数学符号,请参见this以获得证明和符号)

到目前为止,我还没有找到一个适合Python工作的工具。如果有的话,我会感兴趣的。此外,虽然我没有R方面的经验,但我知道R通常用于此类任务,因此我也会对其中一个感兴趣(TVD计算是我算法的最后一步,因此我想从文件中读取一些数据、进行计算并打印数字并不难,即使我对R完全陌生)

我想补充一点,我主要对正态分布感兴趣,因此严格来说,一个用于正态分布的工具非常受欢迎

如果不存在这样的工具,那么任何帮助调整来自this question的答案以使用内置概率函数的方法也将大有裨益

先谢谢你


Tags: 工具the距离hereis符号this感兴趣

热门问题