关于如何在单词列表上创建随机森林分类器有什么建议吗？ - 问答 - Python中文网

关于如何在单词列表上创建随机森林分类器有什么建议吗？

2024-09-30 14:27:50 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我最近读了一篇论文“用深度神经网络进行政治图像分析”，作者对图像进行了目标检测。在检测到目标后，将发现的目标串（如果满足一定的概率阈值）作为特征，对图像类进行随机森林分类器的训练和测试。他们试图根据在图片中发现的物体，将图片分类为来自共和党或民主党参议员的图片

我正在尝试重新创建类似的东西，但是我很难找到实现随机林的第二个组件的方法。我能够成功地在带有两个目标检测组件的图像上运行目标检测，但是我很难想出一个如何将这些对象输入到随机林的计划

以下是我的数据框架中的特性，为了简单起见，这些特性被分解为一些变量，-1,0,1的标签就是我想要的标签

labels_res = ["suit", "Loafer", "unicycle", "Scottish deerhound", "trench coat"]
scores_res = [0.39158088, 0.19913094, 0.026774898, 0.022956373, 0.01655933]
labels_vgg = ["Loafer", "suit", "jean", "minivan", "unicycle"]
scores_vgg = [0.08161158, 0.073884524, 0.059617866, 0.049262974, 0.037928864]
label = -1

显然，这些特定对象中的大多数都没有帮助（因为可能性很低），但我请求帮助的更多是一般概念

有没有人建议如何使用labels_res和labels_vgg中的对象，并使用这些对象来训练以这种方式设置的数据的RF分类器

我很感激你的意见

Tags：数据对象图像目标 labels 分类器组件图片

1条回答

网友

1楼 · 发布于 2024-09-30 14:27:50

我没有读过这篇论文，但是我假设他们把对象检测NN中的单词标签简单地当作一段文本，使用一个随机森林分类器，通过一个经典的文档分类管道来处理

所以，如果你在谷歌上搜索“文档分类”或“单词包”，你应该很容易找到该怎么做。Scikit Learn在文档中有这样的例子。您的“文档”是NN对象检测器中的对象类列表

当然，您可以使用任何能够处理广泛稀疏输入的分类器，这对于单词包来说是典型的。不一定是随机森林

将NN返回的概率添加为附加特性是否可以提高性能，这将是一个有趣的问题

相关问题更多 >

编程相关推荐

热门问题

热门文章