MetaFormer is Actually What You Need for Vision|电子爱好者

admin管理员组
文章数量:1585123

摘要

在Transformer中，早期人们发现是其中的注意力机制起了很重要的作用，但后续其他的研究发现除了注意力模块，其他模块也能起到一定的作用。所以文章提出了：其实这些具体的模块并不重要，Transformer的成功来自于其整体架构。
论文地址：MetaFormer is Actually What You Need for Vision

方法

论文提出了叫PoolFormer的模型，整体结构和其他模型类似，只是将token mixer的部分替换为pool池化层。如图1。

图1

池化算子的描述如下：

伪代码逻辑如下：

由于池化算子的复杂度比自注意力和spatial MLP要小，与要处理的序列长度呈线性长度，且没有可学习的参数，所以可以采用分阶段的方法。模型分了四个阶段，如图2。假设总共有L个PoolFormer块，则四个阶段分别分配L/6、L/6、L/2、L/6个。

图2

每个阶段的参数如下图3。

图3

实验

在图像分类任务上，PoolFormer性能都超过了同等规模的其他模型。

目标检测和实例分割上使用COCO数据集，在以更少的参数的前提下取得了比ResNet更高的性能。

语义分割任务上也超过了ResNet、ResNeXt和PVT。

消融实验中，论文将池化模块替换成恒等映射，也保留了较高的精度。在此基础上改变池化核尺寸、归一化方法、激活函数影响都不大。

消融实验结果说明图1中token mixer这个部分，具体采用哪种方法并不关键，网络模型的整体结构才是对性能提升最重要的。因此整体的结构被提炼出来，被命名为Meta Former，如图1最左边的模型。

本文标签： MetaFormer Vision

版权声明：本文标题：MetaFormer is Actually What You Need for Vision 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1725975499a1051151.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

MetaFormer is Actually What You Need for Vision

摘要

方法

实验

更多相关文章

Google AIY Vision Kit安装及国内配置

Tri-Perspective View for Vision-Based 3D Semantic Occupancy Prediction论文笔记

[SAM]A Comprehensive Survey on Segment Anything Model for Vision and Beyond

使用 Apple Vision Pro 的十大应用创意

【MetaFormer】MetaFormer is Actually What You Need for Vision_MetaFormer 用于计算机视觉任务的派生模型

深度学习——MetaFormer Is Actually What You Need for Vision

MetaFormer is Actually What You Need for Vision

立体视觉（Stereo Vision）-本征矩阵（essential matrix）和基本矩阵(fundamental matrix)

【Transformer】15、PoolFormer: MetaFormer is Actually What You Need for Vision

发表评论

推荐文章

如何提取CAD图纸里的标注？CAD文件标注提取方法分享

cad缩小_CAD打印怎么完全布满图纸

百度网盘下载文件完成，打开文件时出现文件删除或已修改

阿里云网盘和百度网盘功能体验上谁更胜一筹呢?

学校宿舍路由器只能登陆一个人的账号上网怎么办？

热门文章

小白教程：WIN10如何关闭更新（windows updatewindows update medic service）

windows10系统中如何用telnet命令Ping端口

一句代码让电脑定时重启，关机，取消关机

互相成就：Massive quantities of data； The new norm of eval

2019的百度网盘下载速度太慢老是限速怎么解决？

fedora20 安装搜狗输入法及各种问题的解决

【2023年1月·第一周】-单词学习记录(1月2日-1月8日)

Linux 下Wine安装与QQ轻聊版安装

MacBook忘记开机密码啦！教你怎么找回密码

家用服务器 无线路由器,评测六款热门家用Wi-Fi 6路由器

最新文章

Windows 10版本business_editions和consumer_editions的区别

windows10 显卡GTX1050安装tensorflow-gpu教程: win10+CUDA9.0+CUDNN7.1+tensorflow1.9(或者1.10)

建立虚拟机Ubuntu中ROS与Windows10中ABB Robot Studio的通信连接

Python学习（一）-环境搭建之PyCharm专业版破解

Pycharm的安装与激活（超详细，教育版）

python专业版安装_详解pycharm2020.1.1专业版安装指南(推荐)

Windows10 Bazel 编译 Tensorflow 2 C++ dll 和 lib 文件

Windows10更改语言为英语其他语言

Windows安装激活注意事项

[转帖]windows10,business版和consumer版本区别

OpenCV 4.0 在Windows10系统下的安装教程

在 Windows 10 中退出 S 模式

ubuntu主机 vmware player虚拟机安装Windows10

Visual Studio 2017 正式版 激活 企业版序列号+专业版序列号

卸载pycharm社区版安装专业版，远程连接AutoDL------自用

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

家用服务器无线路由器,评测六款热门家用Wi-Fi 6路由器

Visual Studio 2017 正式版激活企业版序列号+专业版序列号

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载