MLP-Mixer: AN all MLP Architecture for Vision|电子爱好者

admin管理员组
文章数量:1663028

发表于NeurIPS 2021, 由Google Research, Brain Team发表。

Mixer Architecture

Introduction

当前的深度视觉结构包含融合特征(mix features)的层:(i)在一个给定的空间位置融合。(ii)在不同的空间位置，或者一次融合所有。
在CNN中，(ii) 是由N x N(N > 1 )卷积和池化完成的。更深的神经元有更深的感受野。同时 1 x 1的卷积完成了(i)。
在 Vision Transformer和其他基于attention-based architectures，自监督层同时做到了(i)和(ii), 而MLP-blocks 做到了(i)。
因此Mixer architecture的内在思想是去清晰区分per-location(channel-mixing) 操作(i) 以及cross-location(token-mixing)operations(ii)。这些操作都由MLPs完成。

Steps

Mixer的输入是S个无重叠的图像块,每一块投影成维度C的隐层，也就是一个二维真值输入表， X ∈ R S × C X \in \mathbb{R}^{S \times C} X∈RS×C。 S维度就代表空间，C代表同一空间位置的不同特征。
Mixer 包括同一尺寸的多层，每层包含两个MLP块。第一个是token-mixing MLP：作用于X的列（通过将X转置 X T X^T XT）。第二个是channel-mixing MLP：作用于行。
每一个模块包含两个全连接层和一个非线性层。

版权声明：本文标题：MLP-Mixer: AN all MLP Architecture for Vision 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1729977720a1218223.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

Swin Transformer Hierarchical Vision Transformer

12天前

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows Tags: Swin Transformer 发表日期: 2021 星级 : ★★★★★ 模型

Distributed Database Using Sharding Database Architecture论文阅读

11天前

目录摘要1. 介绍2. 文献综述3. 研究方法3.1. 一种分布式数据库管理系统架构3.2. 联邦多数据库系统体系结构 4. 分布式数据库组件5. 统计数据分布6. 分布式数据库中的分片合并策略7. 分布式数据库策略8. 财政部的案例研究

CLIP-Adapter: Better Vision-Language Models with Feature Adapters

5天前

对比语言图像预训练(CLIP) 虽然prompt-tuning用于textual inputs，但是建议CLIP Adapter在视觉或语言分支上使用功能适配器进行fine-tune CLIPAdapter采用了一个额

开源项目 Architecture 使用教程

2天前

开源项目 Architecture 使用教程 ArchitectureArchitecture: 是一个包含多个关于软件架构设计的幻灯片的仓库。适合开发者了解各种软件架构设计模式和最佳实践。项目地址:https:gitcodegh_m

Swift Composable Architecture 教程

1小时前

Swift Composable Architecture 教程 swift-composable-architecturepointfreecoswift-composable-architecture: Swift Composabl

【备忘】Fastdeploy编译中遇到nvcc fatal : Unsupported gpu architecture ‘compute_35‘的解决

1小时前

Fastdeploy编译中遇到nvcc fatal : Unsupported gpu architecture ‘compute_35‘的解决背景环境复现路径问题的解决背景使用Paddle的Fastdeploy&#xff0

论文精读：Neural Architecture Search without Training

1小时前

文章目录 1. Abstract2. Background3. Method3.1 score3.2 NASWOT3.3 AREA 4. Experiments5. Core code 1. Abstract 手工设计深度神经网络所花费的时

Difference between Software Architecture & Design

1小时前

This article is part of a series based on the book Clean Architecture by Robert C. Martin. Only the topic heading is tak

iOS问题记录 - Building for iOS Simulator, but linking in dylib built for iOS, for architecture arm64

1小时前

文章目录前言开发环境问题描述问题分析1. Intel芯片的Mac上报错2. M系列芯片的Mac上报错3. 动态库引起的报错解决方案补充内容1补充内容2补充内容3最后前言最近用了一个第三方的Flutter插件，

Enterprise Architecture基本操作与常用图例

1小时前

Enterprise Architecture简介 Sparx Systems 的Enterprise Architect 是一个完整生命周期的UML 工具： 设计和建造一个广泛的软件系统业务分析&#xff

神经网络结构搜索Neural Architecture Search

1小时前

感谢博主神经网络结构搜索 (33): 可微方法 Differentiable Neural Architecture NAS 参数和超参数超参数：1）神经网络结构；2&a

Caffe: Convolutional Architecture for Fast Feature Embedding

1小时前

Caffe: Convolutional Architecture for Fast Feature Embedding 1. Caffe https:caffe.berkeleyvision Caffe is a deep le

ARM指令《ARM Architecture Reference Manual》和ARMv7-M Architecture Application Level Reference Manual不同

1小时前

ARM指令《ARM Architecture Reference Manual》和ARMv7-M Architecture Application Level Reference Manual不同 0x00 本文目标本文内容从《AR

debug报错 unsupported architecture of windowsi386 - only ＞ windowsamd64 is supported

1小时前

问题背景：debug报错 unsupported architecture of windowsi386 - only windowsamd64 is supported 解决方法：cmd执行