为什么TransformerViT 中的Position Encoding能和Feature Embedding直接相加？|电子爱好者

admin管理员组
文章数量:1612065

前言

刚开始学习Transformer / ViT的时候会发现为什么作者会将Position Encoding直接和Feature Embedding相加？当时的第一反应是，为什么不是concat，因为两者分明是两种异构的信息，为什么能放在一起相加呢？不应该concat才合理么？最近对一些工作做收尾的时候发现了这个后来被我遗漏的问题。（如果不知道Position Encoding是啥的建议先去阅读一下原论文）

问题

从向量空间的角度来看，我原本有一个Feature Embedding向量矩阵，我再加上一个Position Encoding，那不就意味着我原本的Feature Embedding向量的大小和方向都发生了变化么？而Positon Encoding代表的是Feature Embedding中的每个feature的相对/绝对位置，直觉上来讲，在通道维上concat是一个符合深度学习逻辑的操作，那么为什么原文作者最后选择了直接对两者做相加呢？

推理

以语句为例，首先，我们先尝试用concat的方法。我们给原始输入向量的每个位置 concat上一个代表位置信息的向量 (N代表共有N个位置)形成,它也可以表示为这个形式。

接着，对这个新形成的向量做变化，比如linear projection。

记变换矩阵，就是需要变换到的维度（这里为了方便，直接假设原输入的维度与嵌入维度一致，都是），它也可以表示为，其中。

现在进行变换：

其中，就是对原始输入做了嵌入之后的向量，而就是对位置向量做了嵌入之后的表示。即 Feature Embedding 和 Position Encoding。

于是，由变换结果可知，在原始向量上concat一个代表位置信息的向量，再经过变换，最终的效果等价于：先对原始输入向量做变换，然后再加上位置嵌入。

另一方面，concat会使网络进入深层之后参数量剧增，这是很不划算的。

本文标签： Position ViT Transformer Embedding feature

版权声明：本文标题：为什么TransformerViT 中的Position Encoding能和Feature Embedding直接相加？内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1728604132a1165237.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

为什么TransformerViT 中的Position Encoding能和Feature Embedding直接相加？

前言

问题

推理

更多相关文章

解决position: fixed下如何使用margin

UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position……错误的解决，亲测有效

css position:absolute 父元素高度塌陷

position:上下左右都为0是有什么作用

MySQL：Data truncation: Invalid JSON text: “Invalid value.“ at position 1 in value for column

position fixed 固定定位失效问题及解决方案

【Python】re.error: bad escape s at position 0

【python-bug】日期正则表达式 unbalanced parenthesis at position 64

正确处理listview的position

前端——html定位position用法(相对位置问题)

css的position属性取值fixed固定底部

使用 position:sticky 实现粘性布局

设置position（absolute,fixed）导致flex布局不生效

Duplicated tag: ‘properties‘ (position: START_TAG seen ...＜!--u7248u672cu53f7u7edfu4e00 --＞n

如何在ViewPager外部获取“当前显示的页面的位置position”

position的四个属性以及之间的区别

position为fixed时设置z-index失效，层级定位失败

position和float的区别

python2（中文编码问题）：UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 1

JS解决position:sticky的兼容性问题

发表评论

推荐文章

AI公开课：18.05.05 施尧耘(阿里云量子技术CS)—清华AI第四讲之《人工智能与量子计算》Quantum课堂笔记——带你了解量子计算

position:absolute 父元素高度塌陷

惠普m128fn中文说明书_惠普m128fp使用方法

如何彻底删除打印机驱动程序

QDir::currentPath() 和 QApplication::applicationDirPath() 区别和用法

热门文章

2022JAVA面试题附答案(长期更新)

（2022版）一套教程搞定k8s安装到实战 | Kubernetes基础

一文读懂量化系统接入及相关平台

connection refused：no further information

C++面试八股文快问快答の基础篇

excel一列求和_超级简单实用excel制作表格，手把手教学（适合无根基初学者）...

php生成值班表,EXCEL表制作自动排列值班表【excel值班表表格制作教程】

抖音 触摸精灵_触控精灵app下载-触控精灵手机版 v1.3.2 - 安下载

Node Sass does not yet support your current environment解决方法

git pull 时出现：There is no tracking information for the current branch. Please specify which branch...

最新文章

计算机系统的用户分那几类,windows7有几种类型账户权限分别是什么

windows计算机查看里设置,windows10电脑配置怎么查看

js判断电脑是windows系统还是mac系统(干货满满哦)

设置计算机系统语言,windows系统默认语言如何设置-windows系统默认语言设置方法 - 河东软件园...

w ndows10摄像头设置,windows10系统电脑摄像头怎么打开

在Mac 电脑上使用虚拟机 VirtualBox 安装 Windows 11 问题：当前电脑不满足安装Windows 11 的条件要求...

【windows】windows 11 安装解决 这台电脑无法运行 Windows 11

Windows完全更换ubuntu系统

问题：windows日志系统事件36887造成电脑蓝屏重启

苹果电脑装双系统利弊有哪些

苹果 MAC 电脑 boot camp 助手装 Windows10 双系统出现的各种问题和解决方法

如何在Windows电脑上启动并配置SSH服务

如何查看自己windows电脑的IP地址

清除计算机用户缓存,如何在Windows 7中清除内存缓存，释放电脑空间？

windows7到底是多用户多任务操作系统还是单用户多任务操作系统

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

抖音触摸精灵_触控精灵app下载-触控精灵手机版 v1.3.2 - 安下载

【windows】windows 11 安装解决这台电脑无法运行 Windows 11

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载