如何查找scikit learn中保留的变量

2024-10-06 12:33:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我在scikit中运行一些算法。就像现在我用的是随机的。但这个问题涉及到scikit中的任何ml算法。在

我最初的训练数据是149x56。现在我要做的是:

from sklearn.linear_model import RandomizedLasso
est_rlasso = RandomizedLasso(max_iter=1000)
# Running Randomised Lasso
x=est_rlasso.fit_transform(tourism_X,tourism_Y)
x.shape

>>> (149x36). 

因此,如果您看到它给出了最初56个要保留的36个最佳特性,并将数据集从149x56转换为149x36。但问题是它保留了哪些36个特性?scikit最大的问题是它去掉了变量头。所以现在我不知道这个算法保留了哪些特性,以及在最后一个X中删除了哪个特性,因为最后的X没有头要交叉检查。在

这在scikit中的任何ml算法实现中都很常见。如何克服这一点?比如,如果我需要找出哪些变量是有意义的,或者如果我在运行一个回归模型,那么系数代表哪些变量,因为我可能使用Onehotencoder来转换分类变量,然后它会改变原始变量的var顺序。在

有什么想法吗?在


Tags: 数据fromimport算法model特性sklearnscikit