【目标检测】YOLOv3

编程入门 行业动态 更新时间:2024-10-08 13:32:38

【<a href=https://www.elefans.com/category/jswz/34/1770031.html style=目标检测】YOLOv3"/>

【目标检测】YOLOv3

文章目录

    • 一、YOLOv3模型结构
    • 二、YOLOv3-SPP模型结构
    • 三、SPP模块
    • 四、对YOLOv3-SPP模型结构的理解

SPP全称为Spatial Pyramid Pooling(空间金字塔池化结构)

参考资料:YOLO系列理论合集(YOLOv1~v3)

yolov3-spp深度剖析

一、YOLOv3模型结构

二、YOLOv3-SPP模型结构

三、SPP模块

对比上面两个图可以发现,YOLOv3-SPP就是在YOLOv3的Convolutional Set模块中插入了SPP模块,SPP模块结构如下:


可以发现,SPP模块由四个分支组成。为了保证Concatenate时候每个分支Tnesor的H和W相同,在进行 Maxpool 时要进行不同程度的Padding,输入每个分支的输入和输出的shape是相同的,均为[N,C,H,W]。经过Concatenate之后,对channel进行合并,得到的Tnesor为[N,4C,H,W],即channel变为4倍,H和W不变。

SPP模块实现了不同尺度的特征融合

YOLOv3-SPP的Convolutional Set模块为:

四、对YOLOv3-SPP模型结构的理解

仔细观察YOLOv3-SPP模型结构图可以发现,只有在产生最小尺寸的特征图的Convolutional Set中添加了SPP模块。按照正常思路来说应该在三个特征图之前都加上SPP模块才对呀,这是为什么呢?

当然三个都加也是可以的,但是有没有必要呢?

如下图所示,横坐标为输入图像尺寸,纵坐标为MAP。右上角的黄色圆点折线表示YOLOv3-SPP1,即只在一个预测分支中添加SPP模块的结果,绿色三角形折线表示YOLOv3-SPP3,即在三个预测分支中都添加SPP模块的结果。可以发现二者差别不大,因此选用YOLOv3-SPP1可以加快训练速度,降低模型训练时间。当然如此不考虑训练时间问题,只追求更高的精度(MAP),用YOLOv3-SPP3会更好。

更多推荐

【目标检测】YOLOv3

本文发布于:2024-02-13 15:32:40,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1759258.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:目标

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!