我正在使用scikit learn建立一个分类系统。在训练分类器之后,我想把它和必要的转换(比如DictVectorizer)一起保存以供重用
我正在寻找一种方法来过滤未分类数据的传入流,这将馈送到特征变换和分类器。理想情况下,我希望移除并标记包含分类属性和/或新属性的新值的向量
我已经使用DictVectorizer.restrict()方法来过滤输入数据,但这只会导致矢量器过滤新属性并将新值归零,我还想将不一致的数据放在一边。有没有一种简单的方法可以提取出值和属性不在初始数据集中的行
Tags:
没有任何东西内置到sciket learn中,因为删除行在当前API中是不容易完成的。 编写一个基于DictVectorizer输出的自定义函数/类应该很容易
相关问题 更多 >
编程相关推荐