目标检测——Yolov4|电子爱好者

admin管理员组
文章数量:1596407

文章目录

- Bag of freebies(BOF)
- - 数据增强
  - 网络正则化的方法
  - 类别不平衡，损失函数设计
- Bag of specials(BOS)
- - SPPNet(Spatial Pyramid Pooling)
  - CSPNet（Cross Stage Partial Network）
  - CBAM（Convolutional Block Attention Module）
  - PAN(Path Aggregation Network)
  - 激活函数Mish
  - eliminate grid sensitivity
- 整体网络架构

Bag of freebies(BOF)

数据增强

只增加训练成本，但是能显著提高精度，并不影响推理速度
数据增强：调整亮度、对比度、色调、随机缩放、剪切、翻转、旋转
Mosaic data augmentation

Random Erase：用随机值或训练集的平均像素值替换图像的区域
Hide and Seek：根据概率设置随机隐藏一些补丁

Self-adversarial-training(SAT): 通过引入噪音点来增加游戏难度

网络正则化的方法

网络正则化的方法：Dropout、Dropblock等
DropBlock 之前的dropout是随机选择点(b)，现在去掉一个区域。

类别不平衡，损失函数设计

Label Smoothing
神经网络最大的缺点：自觉不错（过拟合），让它别太自信。
例如原来标签为 ( 0 , 1 ) : [ 0 , 1 ] × ( 1 − 0.1 ) + 0.1 / 2 = [ 0.05 , 0.95 ] (0,1):[0,1] \times(1-0.1)+0.1 / 2=[0.05,0.95] (0,1):[0,1]×(1−0.1)+0.1/2=[0.05,0.95]

使用之后效果分析（右图）：簇内更紧密，簇间更分离

IOU损失
IOU损失：1-IOU

有哪些问题呢？
没有相交则IOU=0无法梯度计算，相同的IOU却反映不出实际情况到底是什么样子。

GIOU损失
公式: L G I o U = 1 − I o U + ∣ C − B ∪ B g t ∣ ∣ C ∣ \mathcal{L}_{G I o U}=1-I o U+\frac{\left|C-B \cup B^{g t}\right|}{|C|} LGIoU=1−IoU+∣C∣∣C−B∪Bgt∣

引入了最小封闭形状C（C可以把A，B包含在内）

在不重叠情况下能让预测框尽可能朝着真实框前进，但是如果两个框重叠，则失效。

DIOU损失
公式： L D I o U = 1 − I o U + ρ 2 ( b , b g t ) c 2 \mathcal{L}_{D I o U}=1-I o U+\frac{\rho^{2}\left(\mathbf{b}, \mathbf{b}^{g t}\right)}{c^{2}} LDIoU=1−IoU+c2ρ2(b,bgt)
其中分子计算预测框与真实框的中心点欧式距离d
分母是能覆盖预测框与真实框的最小BOX的对角线长度c
直接优化距离，速度更快，并解决GIOU问题

CIOU损失
公式: L C I o U = 1 − I o U + ρ 2 ( b , b g t ) c 2 + α v \mathcal{L}_{C I o U}=1-I o U+\frac{\rho^{2}\left(\mathbf{b}, \mathbf{b}^{g t}\right)}{c^{2}}+\alpha v LCIoU=1−IoU+c2ρ2(b,bgt)+αv v = 4 π 2 ( arctan ⁡ w g t h g t − arctan ⁡ w h ) 2 v=\frac{4}{\pi^{2}}\left(\arctan \frac{w^{g t}}{h^{g t}}-\arctan \frac{w}{h}\right)^{2} v=π24(arctanhgtwgt−arctanhw)2
α = v ( 1 − I o U ) + v \alpha=\frac{v}{(1-I o U)+v} α=(1−IoU)+vv
损失函数必须考虑三个几何因素：重叠面积，中心点距离，长宽比
其中 α \alpha α 可以当做权重参数

DIOU-NMS
之前使用NMS来决定是否删除一个框，现在改用DIOU-NMS
公式: s i = { s i , IoU ⁡ − R D I o U ( M , B i ) < ε , 0 , IoU ⁡ − R D I o U ( M , B i ) ≥ ε , R D I o U = ρ 2 ( b , b g t ) c 2 s_{i}=\left\{\begin{array}{l}s_{i}, \operatorname{IoU}-\mathcal{R}_{D I o U}\left(\mathcal{M}, B_{i}\right)<\varepsilon, \\ 0, \operatorname{IoU}-\mathcal{R}_{D I o U}\left(\mathcal{M}, B_{i}\right) \geq \varepsilon,\end{array} \quad \mathcal{R}_{D I o U}=\frac{\rho^{2}\left(\mathbf{b}, \mathbf{b}^{g t}\right)}{c^{2}}\right. si={si,IoU−RDIoU(M,Bi)<ε,0,IoU−RDIoU(M,Bi)≥ε,RDIoU=c2ρ2(b,bgt)
不仅考虑了loU的值,还考虑了两个Box中心点之间的距离
其中M表示高置信度候选框，Bi就是遍历各个框跟置信度高的重合情况。

SOFT-NMS
更改分数而且直接剔除

Bag of specials(BOS)

增加稍许推断代价，但可以提高模型精度的方法
网络细节部分加入了很多改进，引入了各种能让特征提取更好的方法
注意力机制，网络细节设计，特征金字塔等

SPPNet(Spatial Pyramid Pooling)

V3中为了更好满足不同输入大小，训练的时候要改变输入数据的大小
SPP其实就是用最大池化来满足最终输入特征一致即可

CSPNet（Cross Stage Partial Network）

每一个block按照特征图的channel维度拆分成两部分
一份正常走网络，另一份直接concat到这个block的输

CBAM（Convolutional Block Attention Module）

注意力机制：包括通道注意力机制（Channel Attention Module）和空间的注意力机制(Spatial Attention Module)。

优点是更简单了，速度相对能更快一点。

PAN(Path Aggregation Network)

得先从FPN说起,FPN自顶向下的模式，将高层特征传下来（不是双向的，我们希望增加一个自下向上的传递路径）

PAN 引入了自底向上的路径，使得底层信息更容易传到顶部,并且还是一个捷径

不同之处在于，YOLOV4中并不是加法，而是拼接

激活函数Mish

Mish 函数
Relu有点太绝对了，Mish更符合实际
公式: f ( x ) = x ⋅ tanh ⁡ ( ln ⁡ ( 1 + e x ) ) f(x)=x \cdot \tanh \left(\ln \left(1+e^{x}\right)\right) f(x)=x⋅tanh(ln(1+ex))
但是计算量确实增加了，效果会提升一点

eliminate grid sensitivity

比较好理解，坐标回归预测值都在0-1之间，如果在grid边界怎么表示？
此时就需要非常大的数值才可以达到边界,为了缓解这种情况可以在激活函数前加上一个系数（大于1的）： b y = σ ( t y ) + c y b_{y}=\sigma\left(t_{y}\right)+c_{y} by=σ(ty)+cy

整体网络架构

本文标签：目标

版权声明：本文标题：目标检测——Yolov4 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1728256231a1151046.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

目标检测——Yolov4

文章目录

Bag of freebies(BOF)

数据增强

网络正则化的方法

类别不平衡，损失函数设计

Bag of specials(BOS)

SPPNet(Spatial Pyramid Pooling)

CSPNet（Cross Stage Partial Network）

CBAM（Convolutional Block Attention Module）

PAN(Path Aggregation Network)

激活函数Mish

eliminate grid sensitivity

整体网络架构

更多相关文章

Tensorflow+SSD+Yolo（目标检测）文章1：深度学习环境搭建：win10+GTX1060 + tensorflow1.8.0+keras+cuda9.2+cudnn7.1.4

Armbian专题——YOLO目标识别

YOLOv7（目标检测）入门教程详解---环境安装

Win10下搭建旷视YOLOX(新一代anchor-free目标检测网络)并训练自定义CoCo格式数据集

激光雷达目标检测 （上）

Deep Learning for Visual Tracking: A Comprehensive Survey(单目标跟踪目前最好的综述类文章)

linux下插入U盘显示目标只读，windows下正常【已解决】

目标检测评价指标

【实战系列】重装系统前如何在PE里查看目标系统信息和用户资料路径？

目标检测第1步：如何在Windows 10下安装MiniConda？

遮挡目标检测持续汇总

程序猿来找找自己的目标

YOLOv5实现目标识别全流程【超级详细！】

【学习总结】win10下yolov5使用GPU训练自己的模型，同时调用网络摄像头识别目标、学习指南与踩坑经验

【3D目标检测】OpenPCDet自定义数据集训练

群硕董事长刘英武：要去挑战伟大的目标

目标跟踪OTB、VOT、UAV123、TC128、GOT-10k、LaSOT和TrackingNet数据集百度云下载

计算机网络，ping连接同一个WiFi的电脑，回复无法访问目标主机，但是数据包已接收（防火墙已关）

目标检测算法简介

adb打开网页_关于ADB，请教如何通过指定APP打开目标网页

发表评论

推荐文章

迅捷PDF编辑器如何编辑PDF文字图文教程

后疫情时代下的数字化发展

科学发明家特斯拉传记

变形空间和候选消除算法（Candidate-Elimination）C++实现

gre阅读passage175-246

热门文章

【Linux】磁盘情况、挂载，df -h无法看到的卷

解决遇到U盘无法停止“通用卷”的五种方法

安卓系统修改开机LOGO

服务器上面显示横杠,系统开机左上角显示一横杠一直闪没法系统

自然语言处理NLP星空智能对话机器人系列：Facebook StarSpace框架案例数据加载

2w字详解数据湖：概念、特征、架构与案例

在Linux（Ubuntu）下安装Arial、Times New Roman等字体

微软发布6月份安全更新程序补丁(For Windows xp20032000vista和Office 20032007所有更新产品补丁）

如何保持 Photoshop 处于最新状态

时钟抖动，简单区分period jitter，long term jitter，ppm

最新文章

win11最低硬件要求破解方法,win11更新硬件限制破解

IP修改后自动还原（IP地址无法修改）

连接另一台电脑下的虚拟机系统

mac系统还原和更新

联想台式机系统还原，Win 11系统安装提示:若要获取疑难解答提示,请使用其他设备并访问aka.msnetworksetup

如何关闭windows服务器的密码过期提示？

win7+win10+向日葵开机棒

七.deepin备份还原

计算机桌面怎么突然变大了,电脑桌面比例突然变大？一招还原比例！

计算机桌面怎么右挪,电脑桌面的任务栏跑到右边去了怎么办如何还原 - 驱动管家...

windows11 BitLocker 强制解锁

【基础】Windows 必会技能 ——解除文件夹文件占用

host文件编辑以后会被自动还原

分享：破解还原精灵的几个小技巧（转）

（八）冰点还原安装及使用

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

激光雷达目标检测（上）

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载