我有一个数据集来建立一个分类程序:
dataset = pd.read_csv(sys.argv[1], decimal=",",delimiter=";", encoding='cp1251')
X=dataset.ix[:, dataset.columns != 'class']
Y=dataset['class']
我只想选择重要功能,所以我选择:
^{pr2}$所以X新的形状是3000x72,而X的形状是3000x130。我想得到一个新的和不在新的功能列表。我该怎么做?在
X是一个带有头的数据帧,但是X\u new是一个没有名字的特性值列表,所以我不能像在pandas中那样合并它。 谢谢你的帮助!在
您可能还想看看Feature Selection。它描述了一些技术和工具来更系统地完成这项工作。在
clf.coef_
返回特性权重列表(在fit()
之后应用)。按权重排序,你会发现哪些不是很有用。在尝试运行以下代码:
“feature_selected”列显示是否选择了该功能。在
相关问题 更多 >
编程相关推荐