我试图建立一个基于连续变量(固定效应)和分类变量(随机效应)的二元反应变量模型。你知道吗
这里是模型方程:Yijk=β
Yijk:会话是否被点击
Xi:会话i中客户的固定效果特征:num\u purchases\u cat1、num\u purchases\u cat2、num\u purchases\u cat3
Zj:随机效应:广告类别(100个类别)
Zk:随机效应:广告价格(5桶)
假设我的数据列包含所有这些列:[clicked,num\u purchases\u cat1,num\u purchases\u cat2,num\u purchases\u cat3,ad\u category,ad\u price]。两个随机效应的广告类别和广告价格是独立的,因此我想适合交叉效应混合效应模型。你知道吗
Python's Documentation声明我需要将整个数据集作为一个组来处理,因此我尝试如下:
import statsmodels.regression.mixed_linear_model as mlm
lmm = mlm.MixedLM(data_train.clicked, data_train[['num_purchases_cat1', 'num_purchases_cat2', 'num_purchases_cat3']], groups=np.ones(data_train.shape[0]))
现在,我正在努力指定exog_re
和exog_vc
。我是简单地把data_train[['ad_category','ad_price']]
还是应该把它转换成一个热编码?如果我只想要随机斜率与随机截距相比,这会发生什么变化?你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐