我尝试使用^{
识别器工作正常,但我真的有一个问题,那就是分别给winStride
、padding
、scale
和{
目前,camera feed的帧大小是1280 X 720,我将其调整为400 X 400,然后使用参数执行detectMultiScale
hogParams = {'winStride': (8, 8), 'padding': (32, 32), 'scale': 1.05, 'finalThreshold': 2}
基于这个answer,我了解这些参数的作用和代表。在
我的问题是,有没有办法用这些值映射图像大小?数学方程式?估计方法?我不一定要一个具体的,甚至不是一个给出所有值的方法,而是一个比试错或幻数更好的方法。在
大多数参考资料和教程几乎都使用幻数,而没有给出它们是如何获得的。在
这里没有银弹。不幸的是,由于输入数据的不同,最优的解决方案会有所不同。在
以下是一些额外的指导:
最好的办法是做一点实验。选择一些你认为能代表你的用例的图像/视频,创建一个端到端的设置,并使用几个不同的参数设置来播放。如果没有检测到人,请根据探测器的大小来考虑他们的大小。它们比那个大吗?小一点?如果它们较小,可能会增加比例因子,或增加级别的数量。如果他们更大,缩小输入图像更多。在
旁注:如果你只是简单地调整大小而不裁剪,你会得到不好的结果。调整大小为相同的纵横比(如711x400),或者在调整大小之前将初始图像裁剪为正方形。在
相关问题 更多 >
编程相关推荐