关于如何在单词列表上创建随机森林分类器有什么建议吗?

2024-09-30 14:27:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我最近读了一篇论文“用深度神经网络进行政治图像分析”,作者对图像进行了目标检测。在检测到目标后,将发现的目标串(如果满足一定的概率阈值)作为特征,对图像类进行随机森林分类器的训练和测试。他们试图根据在图片中发现的物体,将图片分类为来自共和党或民主党参议员的图片

我正在尝试重新创建类似的东西,但是我很难找到实现随机林的第二个组件的方法。我能够成功地在带有两个目标检测组件的图像上运行目标检测,但是我很难想出一个如何将这些对象输入到随机林的计划

以下是我的数据框架中的特性,为了简单起见,这些特性被分解为一些变量,-1,0,1的标签就是我想要的标签

labels_res = ["suit", "Loafer", "unicycle", "Scottish deerhound", "trench coat"]
scores_res = [0.39158088, 0.19913094, 0.026774898, 0.022956373, 0.01655933]
labels_vgg = ["Loafer", "suit", "jean", "minivan", "unicycle"]
scores_vgg = [0.08161158, 0.073884524, 0.059617866, 0.049262974, 0.037928864]
label = -1

显然,这些特定对象中的大多数都没有帮助(因为可能性很低),但我请求帮助的更多是一般概念

有没有人建议如何使用labels_reslabels_vgg中的对象,并使用这些对象来训练以这种方式设置的数据的RF分类器

我很感激你的意见


Tags: 数据对象图像目标labels分类器组件图片
1条回答
网友
1楼 · 发布于 2024-09-30 14:27:50

我没有读过这篇论文,但是我假设他们把对象检测NN中的单词标签简单地当作一段文本,使用一个随机森林分类器,通过一个经典的文档分类管道来处理

所以,如果你在谷歌上搜索“文档分类”或“单词包”,你应该很容易找到该怎么做。Scikit Learn在文档中有这样的例子。您的“文档”是NN对象检测器中的对象类列表

当然,您可以使用任何能够处理广泛稀疏输入的分类器,这对于单词包来说是典型的。不一定是随机森林

将NN返回的概率添加为附加特性是否可以提高性能,这将是一个有趣的问题

相关问题 更多 >