如何使用scipy.stats中的multivariable_normal.cdf函数始终获得相同的结果？

import numpy as np from scipy.stats import multivariate_normal def normal_cdf_3d(d_1, d_2, d_3, correl_1_2, correl_1_3, correl_2_3): mean = np.array([0, 0, 0]) cov = np.array( [ [1, correl_1_2, correl_1_3], [correl_1_2, 1, correl_2_3], [correl_1_3, correl_2_3, 1], ] ) x = np.array([d_1, d_2, d_3]) y = multivariate_normal(mean=mean, cov=cov).cdf(x=x) return y d_1_ = -0.2304886114323222 d_2_ = -0.1479019945774904 d_3_ = 0.525 correl_1_2_ = 0.5500190982169267 correl_1_3_ = 0.9219544457292886 correl_2_3_ = 0.5916079783099616 a = normal_cdf_3d( d_1=d_1_, d_2=d_2_, d_3=d_3_, correl_1_2=correl_1_2_, correl_1_3=correl_1_3_, correl_2_3=correl_2_3_, ) b = normal_cdf_3d( d_1=d_1_, d_2=d_2_, d_3=d_3_, correl_1_2=correl_1_2_, correl_1_3=correl_1_3_, correl_2_3=correl_2_3_, ) print(a) print(b) if a == b: print(True) else: print(False) # Results # 0.2698170436763295 (a) # 0.2698184075101584 (b) # False

1条回答

网友

1楼 · 发布于 2024-10-09 20:26:59

由于CDF必须在多维空间中通过数值积分计算，因此multivariate_normal对象具有相对较低的相对和绝对收敛容差。另外，积分要考虑的点数是默认的{{CD2}}，在这种情况下是^ {CD3}}。

import numpy as np
from scipy.stats import multivariate_normal

d_1 = -0.2304886114323222
d_2 = -0.1479019945774904
d_3 = 0.525
correl_1_2 = 0.5500190982169267
correl_1_3 = 0.9219544457292886
correl_2_3 = 0.5916079783099616

mean = np.array([0, 0, 0])
cov = np.array(
    [
        [1, correl_1_2, correl_1_3],
        [correl_1_2, 1, correl_2_3],
        [correl_1_3, correl_2_3, 1],
    ]
)
x = np.array([d_1, d_2, d_3])
mvn = multivariate_normal(mean=mean, cov=cov)
print(mvn.abseps, mvn.releps, mvn.maxpts)
# prints
1e-05 1e-05 3000000

增加点数和减小公差将以牺牲性能为代价获得更好的精度。请记住，Python中浮点数的默认精度为1e-17

mvn.cdf(x) - mvn.cdf(x)
# returns:
-9.741263303830738e-06    # Wall time: 1.27 ms

mvn.abseps = mvn.releps = 1e-8
mvn.maxpts = 5_000_000
mvn.cdf(x) - mvn.cdf(x)
# returns:
-3.6016106763625544e-10   # Wall time: 409 ms

mvn.abseps = mvn.releps = 1e-10
mvn.maxpts = 8_000_000
mvn.cdf(x) - mvn.cdf(x)
# returns:
-2.0803747613484802e-11   # Wall time: 2.22 s

mvn.abseps = mvn.releps = 1e-12
mvn.maxpts = 10_000_000
mvn.cdf(x) - mvn.cdf(x)
# returns:
-4.4660386500083861e-12   # Wall time: 3.39 s

这并没有很好的时间伸缩性。如果可能的话，再尝试几次增加点数，直到获得相同的输出

mvn.abseps = mvn.releps = 1e-17
mvn.maxpts = 35_000_000
mvn.cdf(x) - mvn.cdf(x)
# returns:
-1.755373624234835e-12    # Wall time: 11.1 s

mvn.abseps = mvn.releps = 1e-19
mvn.maxpts = 70_000_000
mvn.cdf(x) - mvn.cdf(x)
# returns:
2.7454705175955496e-12    # Wall time: 30 s

mvn.abseps = mvn.releps = 1e-25
mvn.maxpts = 100_000_000
mvn.cdf(x) - mvn.cdf(x)
# returns:
-2.1491142199181468e-12   # Wall time: 39.3 s

根据最近3次运行，计算的可用精度存在限制。您可以只使用“在某个ε内”作为相同的数字是可以接受的，即使它小于Python的精度

def approx_equal(x, y, tol=1e-5):
    return abs(x-y) < tol

相关问题更多 >

编程相关推荐

热门问题

热门文章