我最近读了一篇论文“用深度神经网络进行政治图像分析”,作者对图像进行了目标检测。在检测到目标后,将发现的目标串(如果满足一定的概率阈值)作为特征,对图像类进行随机森林分类器的训练和测试。他们试图根据在图片中发现的物体,将图片分类为来自共和党或民主党参议员的图片
我正在尝试重新创建类似的东西,但是我很难找到实现随机林的第二个组件的方法。我能够成功地在带有两个目标检测组件的图像上运行目标检测,但是我很难想出一个如何将这些对象输入到随机林的计划
以下是我的数据框架中的特性,为了简单起见,这些特性被分解为一些变量,-1,0,1
的标签就是我想要的标签
labels_res = ["suit", "Loafer", "unicycle", "Scottish deerhound", "trench coat"]
scores_res = [0.39158088, 0.19913094, 0.026774898, 0.022956373, 0.01655933]
labels_vgg = ["Loafer", "suit", "jean", "minivan", "unicycle"]
scores_vgg = [0.08161158, 0.073884524, 0.059617866, 0.049262974, 0.037928864]
label = -1
显然,这些特定对象中的大多数都没有帮助(因为可能性很低),但我请求帮助的更多是一般概念
有没有人建议如何使用labels_res
和labels_vgg
中的对象,并使用这些对象来训练以这种方式设置的数据的RF分类器
我很感激你的意见
我没有读过这篇论文,但是我假设他们把对象检测NN中的单词标签简单地当作一段文本,使用一个随机森林分类器,通过一个经典的文档分类管道来处理
所以,如果你在谷歌上搜索“文档分类”或“单词包”,你应该很容易找到该怎么做。Scikit Learn在文档中有这样的例子。您的“文档”是NN对象检测器中的对象类列表
当然,您可以使用任何能够处理广泛稀疏输入的分类器,这对于单词包来说是典型的。不一定是随机森林
将NN返回的概率添加为附加特性是否可以提高性能,这将是一个有趣的问题
相关问题 更多 >
编程相关推荐