CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读|电子爱好者

admin管理员组
文章数量:1663028

CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读

- 介绍
- 方法
- - CBNetV2
  - 融合方式
  - 对Assistant的监督
- 实验
- - 与SOTA的比较
  - 在主流backbone架构上的通用性
  - 与更宽更深的网络比较
  - 与可变形卷积的兼容
  - 在主流检测器上的模型适用性
  - 在Swin Transformer上的模型适用性
  - 消融实验

paper：https://arxiv/pdf/2107.00420v2.pdf
code：https://github/VDIGPKU/CBNetV2

介绍

性能强大的检测器往往需要强大的backbone，而比较常见的增强backbone的方法就是将其变得更深、更宽，或者设计更强大的backbone，且需要在imagenet等数据集上预训练，会有昂贵的预训练成本；当然也可以不使用预训练权重，直接从头开始训练检测器，但这会需要更多的计算资源和训练技巧；

论文提出了一种有效率的方法来融合现有的pre-trained权重作为一个检测器的backbone，不像其他致力于精心制作模块并且需要在ImageNet上预训练来加强模型的表达能力，CBNetv2通过一种新的融合方法直接提升现有的pre-trained模型表达能力，不需要预训练；

如图1所示，并行的backbone（assisting backbone，lead backbone）通过“融合连接”连接到一起；assisting backbone的每个stages的输出流到其后续backbone的并行级stage和较低级别stage；

与简单的网络深化或扩宽不同，CBNetV2融合了多个骨干网络的高、低层特性，并逐渐扩展接收域，以更有效地进行目标检测。值得一提的是CBNetV2不需要为检测器预训练任何模型，只需要使用现有开源pretrained单个backbone的权重来初始化CBNetV2的每个组装backbone；

CBNetV2适用于one-stage, two-stage, anchor-based, anchor-free等检测方法，并且在Faster R-CNN, Mask R-CNN, Cascade R-CNN，Cascade Mask R-CNN，ATSS等方法上均有超过3%的精度提升；

并且CBNetV2方法比那些将网络加深，加宽带来的提升更多，且更有效率，例如Dual-ResNeXt50-32x4d比ResNeXt101-64x4d作为backbone带来了0.7%的AP提升，但只有其70%的参数；
Dual-Swin-T比 Swin-B有更少的参数和FLOPs，并有1.7%的AP提升；
HTC Dual-Swin-B在COCOtest-dev上实现了58.6%的box AP和51.1%的mask AP，在多尺度测试下实现了59.3%的box AP和51.8%的mask AP；

论文的主要贡献：

使用现有的pretrained模型权重建立了一个更强大的backbone CBNetV2，不需要额外预训练；
CBNetV2使用更有效率和更友好的方式来融合较大的backbones，而不是简单的增加网络宽度、深度并在ImageNet上预训练；

本文标签：论文 Backbone composite Network Detection

版权声明：本文标题：CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1729978186a1218279.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读

CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读

介绍

更多相关文章

Few-shot Object Detection via Feature Reweighting

【论文笔记】视觉重定位 PixLoc || Back to the Feature: Learning Robust Camera Localization from Pixels to Pose

RESA: Recurrent Feature-Shift Aggregator for Lane Detection 论文阅读+代码复现(车道线检测)

移动通信专业毕业设计（论文）-自愈双环光纤传输统

spring boot校园商铺系统 毕业设计源码论文+答辩PPT

【论文阅读】Search-Based Testing Approach for Deep Reinforcement Learning Agents

论文阅读：HybridAlpha: An Efficient Approach for Privacy-Preserving Federated Learning

《A Unified Approach to Interpreting Model Predictions》论文解读——解释模型 预测的统一方法

论文笔记：A Robust Learning Approach to Domain Adaptive Object Detection

论文阅读：GS-WGAN: A Gradient-Sanitized Approach for Learning Differentially Private Generators

【论文笔记】An Improved Deep Learning Approach for Retrieving Outfalls Into Rivers From UAS Imagery

计算机组装与维护 参考文献,浅谈计算机的日常维护论文

ICRA2022 SLAM相关论文整理

【论文解读】GPT Understands, Too

论文阅读--Conservative Q-Learning for Offline Reinforcement Learning

【论文合集】Semi-Supervised Semantic Segmentation

计算机视觉论文-2021-06-29

【光流】——GMA:Learning to Estimate Hidden Motions with Global Motion Aggregation论文浅读

《Learning to Estimate 3D Hand Pose from Single RGB Images》 论文笔记

NIPS2018-How Many Samples are Needed to Estimate a Convolutional Neural Network?

发表评论

推荐文章

直播技术学习笔记（直播协议+流媒体服务器+音视频处理+FFmpeg）

Windows11 电脑卡顿反应慢怎么办

【其他】爱奇艺删除“我的电脑”中图标的解决办法？

PyTorch-Estimate-FLOPS 项目使用教程

Visual Studio 2013各个版本密钥(亲测可用)

热门文章

【VIP视频网站项目二】搭建爱奇艺优酷腾讯视频官网首页轮播图效果及实现原理分析

windows脚本 批量删除指定文件夹、指定文件

删除文件夹提示已在另一程序打开，如何强制删除

android 恢复出厂,安卓(Android)手机恢复出厂设置的方法

QEMU仿真路由器

软件测试——测试用例篇

录屏没有声音怎么办？录屏怎么录声音

ios html5 app上架,H5封装的IOS应用上架App Store被拒怎么办

对称密钥算法与非对称密钥算法

CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读

最新文章

如何在电脑上查看连接的WiFi密码？

中国十大IT论坛网站

soho

注意身体健康-转

程序员发展之路

催化剂，抑制剂和变压器：十大主导力量塑造技术

做技术的方向性讨论(论坛帖子整理)

程序员要注意健康一-避免罗京、李钰悲剧：改变我们的酸性体质

看了这篇你肯定瘦 全身上下想瘦哪就瘦哪 - 健康程序员，至尚生活！

免签出国,我们这些懒人的长假有救了

Windows查看连接WiFi密码

[转]明朝出了个张居正 作者：秋风浩荡 -3

什么是soho

看了这篇你肯定瘦 全身上下想瘦哪就瘦哪 - 生活至上，美容至尚！

成功经理人讲座

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

spring boot校园商铺系统毕业设计源码论文+答辩PPT

《A Unified Approach to Interpreting Model Predictions》论文解读——解释模型预测的统一方法

计算机组装与维护参考文献,浅谈计算机的日常维护论文

《Learning to Estimate 3D Hand Pose from Single RGB Images》论文笔记

windows脚本批量删除指定文件夹、指定文件

看了这篇你肯定瘦全身上下想瘦哪就瘦哪 - 健康程序员，至尚生活！

[转]明朝出了个张居正作者：秋风浩荡 -3

看了这篇你肯定瘦全身上下想瘦哪就瘦哪 - 生活至上，美容至尚！

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载