Python混合效应模型中交叉随机效应的表示法

2024-10-03 19:32:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图建立一个基于连续变量(固定效应)和分类变量(随机效应)的二元反应变量模型。你知道吗

这里是模型方程:Yijk=β+Z+Z+ε。你知道吗

Yijk:会话是否被点击

Xi:会话i中客户的固定效果特征:num\u purchases\u cat1、num\u purchases\u cat2、num\u purchases\u cat3

Zj:随机效应:广告类别(100个类别)

Zk:随机效应:广告价格(5桶)

假设我的数据列包含所有这些列:[clicked,num\u purchases\u cat1,num\u purchases\u cat2,num\u purchases\u cat3,ad\u category,ad\u price]。两个随机效应的广告类别和广告价格是独立的,因此我想适合交叉效应混合效应模型。你知道吗

Python's Documentation声明我需要将整个数据集作为一个组来处理,因此我尝试如下:

import statsmodels.regression.mixed_linear_model as mlm
lmm = mlm.MixedLM(data_train.clicked, data_train[['num_purchases_cat1', 'num_purchases_cat2', 'num_purchases_cat3']], groups=np.ones(data_train.shape[0]))

现在,我正在努力指定exog_reexog_vc。我是简单地把data_train[['ad_category','ad_price']]还是应该把它转换成一个热编码?如果我只想要随机斜率随机截距相比,这会发生什么变化?你知道吗


Tags: 数据模型datatrain价格类别效应num