[论文翻译]Attention Is All You Need|电子爱好者

admin管理员组
文章数量:1623797

引言

今天带来神作Attention Is All You Need的翻译，该作提出了Transformer模型。很牛逼的模型像PLATO-2和GPT-3都是基于Transformer。

经典论文翻译系列

摘要

现在主导的序列转录(transduction)模型不是基于复杂的循环网络或就是基于卷积网络，它们都包含一个编码器和一个解码器。表现最好的模型也是通过一个注意力机制来连接编码器和解码器。我们提出一个新的简单的网络架构，Transformer，仅基于注意力机制，完全抛弃了循环和卷积网络。在两个机器翻译任务上的实验表面该模型在质量上更加优越，更易于并行训练从而训练时间大大减少。我们的模型在WMT2014英-德翻译任务上达到28.4BLEU得分，超过了现有最好的结果2分，包括通过集成学习实现的模型。在WMT2014英-法翻译任务上，我们的模型建立了一个新的单一模型最好的BLEU得分——41.8分，在8个GPU上训练了3.5天，这个训练时间只是目前记载的最好的模型训练成本的一小部分。基于有限的训练集或大的训练集，我们的模型成功的应用到英语选区分析(constituency parsing)任务上，说明Transformer模型能很好地推广到其他任务中。

1 简介

循环神经网络，尤其是LSTM和GRU

本文标签：论文 Attention

版权声明：本文标题：[论文翻译]Attention Is All You Need 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1728891862a1178144.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

[论文翻译]Attention Is All You Need

引言

摘要

1 简介

更多相关文章

论文笔记 | The Political Dynamics of Corporate Tax Avoidance: The Chinese Experience

论文笔记 | The effect of tax avoidance crackdown on corporate innovation

论文阅读笔记 1.《Open Flow: Enabling Innovation in Campus Networks》（2022.12.22）

Distinctive Image Features from Scale-Invariant Keypoints论文解读

主动领域自适应(Active Domain Adaptation)部分经典论文汇总

【AI视野·今日CV 计算机视觉论文速览 第204期】Mon, 24 May 2021

CVPR 2022 论文列表

CVPR2022最新106篇论文整理｜包含目标检测、动作识别、图像处理等32个方向

CVPR 2022 最新106篇论文分方向整理｜包含目标检测、动作识别、图像处理等32个方向

【CVPR2022】论文列表与下载——PartThree

【图神经网络】 - GNN的几个模型及论文解析（NN4G、GAT、GCN）

【Transformer系列（3）】 《Attention Is All You Need》论文超详细解读（翻译＋精读）

Transformer论文翻译与理解

论文精读--Attention is all you need

论文解读：Attention Is All You Need

GPT的源头：Attention Is All You Need

【论文翻译】Meta R-CNN : Towards General Solver for Instance-level Low-shot Learning

NLP系列经典论文(1)-- Attention Is All You Need

Attention is all you need文章翻译

ACL-IJCNLP 2021-Sentiment Analysis相关论文整理

发表评论

推荐文章

如何利用kali Linux破解WiFi密码

电商大数据项目-推荐系统实战（一）

(9)How to take a picture of a black hole

删除win10添加的网络位置

RoCE QoS configuration - Priority mapping

热门文章

【无线安全】Kali 暴力破解 WiFi 密码步骤详解

如何有效的禁止Google Chrome自动更新？

auto.js下载安装教程

aircrack-ng破*无线WiFi

Passbolt 密码管理器安装流程

bunsenlasb中文Linux,5个你应该知道的Live Linux桌面发行版

卸载WPS后安装office，office文档图标显示异常的解决方法

软件评价--搜狗输入法

树莓派4b刷系统

Debain系Linux发行版应用安装国民级应用好用的应用商店

最新文章

解决常见Surface上不了应用商店的问题

Chrome扩展程序应用商店方式一

应用市场显示服务器错误的是,win10应用商店打不开服务器出错怎么办

win10企业版如何安装应用商店-默认没有应用商店

windows10 LTSC版本 安装应用商店及聚焦屏保

统信私有化应用商店解决方案发布，轻松解决应用分发管理难题

2021 App上架到 各应用商店（应用宝，华为，vivo，小米，AppStore）

Chrome应用商店打不开问题

Chrome浏览器应用商店扩展插件无法安装的解决办法

rancher应用商店的使用

uni-app应用跳转对应商店

[云原生专题-53]：Kubesphere云治理-操作-通过Kubesphere应用商店一键部署微服务应用-消息中间件RabbitMQ的安装与部署

deepin-appstore 编译及下载的应用无法改变路径说明

如何找到 Microsoft Store 下载的python文件位置

kubesphere发布应用到应用商店完整步骤

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

【AI视野·今日CV 计算机视觉论文速览第204期】Mon, 24 May 2021

【Transformer系列（3）】《Attention Is All You Need》论文超详细解读（翻译＋精读）

windows10 LTSC版本安装应用商店及聚焦屏保

2021 App上架到各应用商店（应用宝，华为，vivo，小米，AppStore）

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载