现在我使用OPTBining模块将所有对数回归建模变量组合在一起。 然而,optbinning模块只需要使用一个变量,例如
variable = "REGION_POPULATION_RELATIVE"
x = df[variable].values
y = df.TARGET.values
from optbinning import OptimalBinning
optb = OptimalBinning(name=variable, dtype="numerical", solver="ls", max_n_prebins=100,
min_prebin_size=0.001, time_limit=50)
optb.fit(x, y)
如何使用循环获取所有变量的装箱结果? 我试着编码
variable_names = train_validation_valid_nonstring_nondatetype_categoryencoders.keys()
for i in variable_names:
optb = OptimalBinning(name=i,dtype="numerical", solver="cp")
optb.fit(x_category_encoders_target, y_category_encoders)
但get error“操作数无法与形状(52803602)(52803,)一起广播” 我得到的dataframe包含数百个变量,如果逐个计算,这将是一个巨大的项目。 请帮帮我,谢谢
要计算数据集中所有变量的最佳组合,可以使用BinningProcess类
教程:http://gnpalencia.org/optbinning/tutorials/tutorial_binning_process_telco_churn.html
文件:http://gnpalencia.org/optbinning/binning_process.html
然后,可以使用方法
get_binned_variable
检索每个变量或给定变量列表的信息。例如:相关问题 更多 >
编程相关推荐