为什么YOLOv3计算偏移值来调整定位框,而不是直接输出边界框的尺寸?

2024-09-30 01:31:49 发布

您现在位置:Python中文网/ 问答频道 /正文

我想了解一下YOLOv3是怎么工作的。这件事仍然让我困惑:YOLO可以确定边界框(坐标和尺寸),但是为什么它不直接输出这些值,而不是用它们来调整锚框呢?你知道吗


Tags: 尺寸yolo边界yolov3锚框
1条回答
网友
1楼 · 发布于 2024-09-30 01:31:49

大多数目标检测算法计算的偏移量(x,y,宽度,高度)的边界框相比,一个固定的锚。你知道吗

锚通常是按照固定网格生成的:对于网格上的每个位置,创建一组具有不同纵横比和不同区域的锚。你知道吗

对于学习算法来说,输出一个相对于固定锚点的偏移量来推断整体坐标比直接寻找整体坐标要容易得多,因为它是一个局部和位置不变的特征。你知道吗

这意味着如果有一只狗在图片的左上角有一个不居中的边界框,算法会被要求像狗在图片的右下角一样输出偏移量,这使得它能够很好地移动,并且不需要它来学习对象在图像中的全局位置。你知道吗

相关问题 更多 >

    热门问题