移入时pymc中离散形式的意外行为

import numpy as np import pymc as pm import matplotlib.pyplot as plt N = 100 shifts = (0, -1) for shift in shifts: obs_mean = 3.5+shift obs_total = int(N*obs_mean) sigma = 0.01*N dice = pm.DiscreteUniform('dice', 1+shift, 6+shift, size=N) @pm.deterministic def calc_total(d=dice): return np.sum(d) total = pm.Normal('total', mu=calc_total, tau=1./sigma, observed=True, value=obs_total) # package the full model in a dictionary model1 = dict(dice=dice, calc_total=calc_total, total=total) # run the basic MCMC: S = pm.MCMC(model1) S.sample(iter=100000, burn=10000) dice_trace = S.trace('dice')[:]-shift plt.hist(dice_trace.flat, bins=(0.5, 1.5, 2.5, 3.5, 4.5, 5.5, 6.5), normed=True, alpha=0.5) plt.show()

import numpy as np import pymc as pm import matplotlib.pyplot as plt N = 100 shifts = (0, -1) for shift in shifts: obs_mean = 3.5 obs_total = int(N*obs_mean) sigma = 0.01*N dice = pm.DiscreteUniform('dice', 1+shift, 6+shift, size=N) @pm.deterministic def dice2(d=dice): return d-shift @pm.deterministic def calc_total(d=dice2): return np.sum(d) total = pm.Normal('total', mu=calc_total, tau=1./sigma, observed=True, value=obs_total) # package the full model in a dictionary model1 = dict(dice=dice, dice2=dice2, calc_total=calc_total, total=total) # run the basic MCMC: S = pm.MCMC(model1) S.sample(iter=100000, burn=10000) dice_trace = S.trace('dice2')[:] plt.hist(dice_trace.flat, bins=(0.5, 1.5, 2.5, 3.5, 4.5, 5.5, 6.5), normed=True, alpha=0.5) plt.show()

2条回答

网友

1楼 · 编辑于 2024-05-18 10:54:06

这是PyMC版本2.3.6中采样步骤的问题。它在版本2.3.2中的工作与预期一样。我在github中与Chris Fonnesbeck讨论了这个问题，他在PyMC的开发版本中纠正了这个问题。以后，请检查您的版本以及它的行为。你知道吗

网友

2楼 · 编辑于 2024-05-18 10:54:06

不清楚为什么你一定会期望一个统一的分布。离散制服只是你的首选。该模型所具有的所有信息是shift=0的350和shift=-1的250之和，并将生成具有此期望的参数估计。当我在每个移位值下运行模型并查看跟踪时，我得到了shift=0的以下分布（仅查看按唯一值的摘要）：

>>> pd.Series(shift_0.flat).value_counts()

2    1526136
4    1526011
3    1511494
5    1503698
6    1471922
1    1460739

与以下期望相对应：

>>> pd.Series(shift_0.flat).mean() * 100

350.02311111111112

对于shift=-1

>>> pd.Series(shift_1.flat).value_counts()

1    1894489
2    1724072
3    1577420
4    1457896
5    1320425
0    1025698
dtype: int64


>>> pd.Series(shift_1.flat).mean() * 100

250.08703333333332

因此，模型的行为似乎和我预期的一样。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章