在Python中如何将数据帧的一列放入poisson分布中

2024-10-01 02:19:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在尝试找到一种方法,使我的一些专栏(包含userclick数据)适合python中的poisson分布。这些列(例如,单击“网站”1,单击“网站”2)可能包含1到数千之间的值。我正试图按照某些人的建议来做这件事resources

We recommend that count data should not be analysed by log-transforming it, but instead models based on Poisson and negative binomial distributions should be used.

我在scipynumpy中发现了一些方法,但这些方法似乎生成了一些具有泊松分布的随机数。然而,我感兴趣的是使我自己的数据符合泊松分布。有什么用Python实现的库建议?在


Tags: 数据方法that网站be建议wepoisson
1条回答
网友
1楼 · 发布于 2024-10-01 02:19:17

这里有一个快速的方法来检查数据是否遵循poisson分布。您可以在假设下绘制它遵循带有速率参数lambda = data.mean()poisson分布

import numpy as np
from scipy.misc import factorial


def poisson(k, lamb):
    """poisson pdf, parameter lamb is the fit parameter"""
    return (lamb**k/factorial(k)) * np.exp(-lamb)

# lets collect clicks since we are going to need it later
clicks = df["clicks_website_1"] 

这里我们用pmf表示possion distribution。在

现在让我们从数据中进行一些建模(单击_website_one) 我们用MLE估计泊松参数, 结果只不过是小气罢了

^{pr2}$

相关问题 更多 >