分布点在数据的分布点上

1条回答

网友

1楼 · 发布于 2024-10-04 09:20:14

这个问题相当混乱，有很多不相关的信息，但在关键点上却模棱两可。我会尽力翻译的。在

我想你想要的是：给定一个未知分布的有限样本，在一个固定值下获得一个新样本的概率有多大？在

我不确定是否有一个普遍的答案，但无论如何，这将是一个问题，问统计学或数学的人。我猜你需要对分布本身做一些假设。在

然而，对于实际情况，找出新值将位于抽样分布的哪个仓位就足够了。在

假设我们有一个分布x，我们把它分成bins。我们可以使用numpy.histogram计算直方图h。在每个bin中找到一个值的概率由h/h.sum()给出。
如果有一个值v=0.77，我们想根据分布知道它的概率，我们可以通过在bin数组中查找索引ind来找到它所属的bin，该索引需要插入这个值以使数组保持排序。这可以使用^{}完成。在

import numpy as np; np.random.seed(0)

x = np.random.rayleigh(size=1000)
bins = np.linspace(0,4,41)
h, bins_ = np.histogram(x, bins=bins)
prob = h/float(h.sum())

ind = np.searchsorted(bins, 0.77, side="right")
print prob[ind] # which prints 0.058

因此，概率是5.8%的概率来采样一个在0.77左右的bin值。在

另一种选择是在bin中心之间插值直方图，以找到概率。在

在下面的代码中，我们绘制一个与问题图片中的分布相似的分布图，并使用两种方法，第一种方法用于频率直方图，第二种方法用于累积分布。在

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章