我一直在尝试找到一种方法,使我的一些专栏(包含userclick数据)适合python中的poisson分布。这些列(例如,单击“网站”1,单击“网站”2)可能包含1到数千之间的值。我正试图按照某些人的建议来做这件事resources:
We recommend that count data should not be analysed by log-transforming it, but instead models based on Poisson and negative binomial distributions should be used.
我在scipy
和numpy
中发现了一些方法,但这些方法似乎生成了一些具有泊松分布的随机数。然而,我感兴趣的是使我自己的数据符合泊松分布。有什么用Python实现的库建议?在
这里有一个快速的方法来检查数据是否遵循poisson分布。您可以在假设下绘制它遵循带有速率参数
lambda = data.mean()
的poisson分布这里我们用pmf表示possion distribution。在
现在让我们从数据中进行一些建模(单击_website_one) 我们用MLE估计泊松参数, 结果只不过是小气罢了
^{pr2}$相关问题 更多 >
编程相关推荐