识别具有新属性和/或值的数据向量

2024-04-20 10:47:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用scikit learn建立一个分类系统。在训练分类器之后,我想把它和必要的转换(比如DictVectorizer)一起保存以供重用

我正在寻找一种方法来过滤未分类数据的传入流,这将馈送到特征变换和分类器。理想情况下,我希望移除并标记包含分类属性和/或新属性的新值的向量

我已经使用DictVectorizer.restrict()方法来过滤输入数据,但这只会导致矢量器过滤新属性并将新值归零,我还想将不一致的数据放在一边。有没有一种简单的方法可以提取出值和属性不在初始数据集中的行


Tags: 数据方法标记属性分类器系统分类情况