PyTorch 的 Autograd|电子爱好者

admin管理员组
文章数量:1627453

PyTorch 的 Autograd

原创 AlanBupt 发布于2019-06-15 22:16:21 阅读数 1175 收藏更新于2019-06-15 22:16:21 分类专栏： Python PyTorch 版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。本文链接： https://blog.csdn/byron123456sfsfsfa/article/details/92210253 收起

PyTorch 作为一个深度学习平台，在深度学习任务中比 NumPy 这个科学计算库强在哪里？我觉得一是 PyTorch 提供了自动求导机制，二是对 GPU 的支持。由此可见，自动求导 (autograd) 是 PyTorch，乃至其他大部分深度学习框架中的重要组成部分。

了解自动求导背后的原理和规则，对我们写出一个更干净整洁甚至更高效的 PyTorch 代码是十分重要的。但是，现在已经有了很多封装好的 API，我们在写一个自己的网络的时候，可能几乎都不用去注意求导这些问题，因为这些 API 已经在私底下处理好了这些事情。现在我们往往只需要，搭建个想要的模型，处理好数据的载入，调用现成的 optimizer 和 loss function，直接开始训练就好了。仔细一想，连需要设置 requires_grad = True 的地方好像都没有。有人可能会问，那我们去了解自动求导还有什么用啊？

原因有很多，可以帮我们更深入地了解 PyTorch 这些宽泛的理由我就不说了，我举一个例子：当我们想使用一个 PyTorch 默认中并没有的 loss function 的时候，比如目标检测模型 YOLO 的 loss，我们可能就得自己去实现。如果我们不熟悉基本的 PyTorch 求导机制的话，对于实现过程中比如 tensor 的 in-place 操作等等很容易出错，导致需要话很长时间去 debug，有的时候即使定位到了错误的位置，也不知道如何去修改。相反，如果我们理清楚了背后的原理，我们就能很快地修改这些错误，甚至根本不会去犯这些错误。鉴于现在官方支持的 loss function 并不多，而且深度学习领域日新月异，很多新的效果很好的 loss function 层出不穷，如果要用的话可能需要我们自己来实现。基于这个原因，我们了解一下自动求导机制还是很有必要的。

本文所有代码例子都基于 Python3 和 PyTorch 1.1, 也就是不会涉及 0.4 以前的 Variable 这个数据结构。在文章中我们不会去分析一些非常底层的代码，而是通过一系列实例来理解自动求导机制。在举例的过程中我尽量保持场景的一致性，不用每个例子都需要重新了解假定的变量。如果发现文章中有错误或者没有讲清楚的地方，欢迎大家在评论区指正或讨论。

计算图

首先，我们先简单地介绍一下什么是计算图（Computational Graphs），以方便后边的讲解。假设我们有一个复杂的神经网络模型，我们把它想象成一个错综复杂的管道结构，不同的管道之间通过节点连接起来，我们有一个注水口，一个出水口。我们在入口注入数据的之后，数据就沿着设定好的管道路线缓缓流动到出水口，这时候我们就完成了一次正向传播。想象一下输入的 tensor 数据在管道中缓缓流动的场景，这就是为什么 TensorFlow 叫 TensorFlow 的原因！emmm，好像走错片场了，不过计算图在 PyTorch 中也是类似的。至于这两个非常有代表性的深度学习框架在计算图上有什么区别，我们待会再说。

计算图通常包含两种元素，一个是 tensor，另一个是 Function。张量 tensor 不必多说，但是大家可能对 Function 比较陌生。这里 Function 指的是在计算图中某个节点（node）所进行的运算，比如加减乘除卷积等等之类的，Function 内部有 forward() 和 backward() 两个方法，分别应用于正向、反向传播。

a = torch.tensor(2.0, requires_grad=True)
b = a.exp()
print(b)
# tensor(7.3891, grad_fn=<ExpBackward>)

       
       
       
       1
2
3
4

在我们做正向传播的时候，需要求导的变量除了执行 forward() 操作之外，还会同时会为反向传播做一些准备，为反向计算图添加一个 Function 节点。在上边这个例子中，变量 b 在反向传播中需要进行的操作是 ExpBackward。

一个具体的例子

了解了基础知识之后，现在我们来看一个具体的计算例子，并画出它的正向和反向计算图。假如我们需要计算这么一个模型：

l1 = input x w1
l2 = l1 + w2
l3 = l1 x w3
l4 = l2 x l3
loss = mean(l4)

       
       
       
       1
2
3
4
5

这个例子比较简单，涉及的最复杂的操作是求平均，但是如果我们把其中的加法和乘法操作换成卷积，那么其实和神经网络类似。我们可以简单地画一下它的计算图：

下面给出了对应的代码，我们定义了input，w1，w2，w3 这三个变量，其中 input 不需要求导结果。根据默认规则，对于 l1 来说，因为输入中有一个需要求导（也就是 w1），所以它自己也需要求导，即 requires_grad=True（如果对这个规则不熟悉，欢迎参考我上一篇博文的第一部分或者直接查看官方 Tutorial 相关部分）。在整张计算图中，只有 input 一个变量是不需要求导的。正向传播过程的具体代码如下：

input = torch.ones([2, 2], requires_grad=False)
w1 = torch.tensor(2.0, requires_grad=True)
w2 = torch.tensor(3.0, requires_grad=True)
w3 = torch.tensor(4.0, requires_grad=True)

本文标签： Pytorch Autograd

版权声明：本文标题：PyTorch 的 Autograd 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1728994060a1182157.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

PyTorch 的 Autograd

PyTorch 的 Autograd

计算图

一个具体的例子

更多相关文章

[六点]莫烦Pytorch代码笔记

Linux服务器下配置深度学习环境（PyTorch）

服务器安装Anaconda和Pytorch

PyTorch 最新安装教程（2021-07-27）

面部表情识别2：Pytorch实现表情识别(含表情识别数据集和训练代码)

pytorch+Anaconda+python3.10+parcharm+win10安装简化教程

Win11 FlowNet2.0＋Pytorch版本 VSCode

完美解决下载安装pytorch cuda版本超级慢的问题

pytorch手动安装开发包

GPU版PyTorch安装、GPU版TensorFlow安装（详细教程）

pytorch环境搭建(GPU)+Anaconda+CUDA+离线安装

win7下一键安装PyTorch

快速安装之前版本的pytorch（以1.8.0为例）

记录代码复现过程中pytorch环境搭建的坑

Pytorch &quot;cuda runtime error (38) : no CUDA-capable device is detected”报错解决

配置服务器pytorchTensorFlow环境+远程连接vscode

pytorch NLP自然语言处理入门一：文本表示

pytorch节省显存_节省新房子的照明

【PyTorch问题】CUDA out of memory. Tried to allocate 4.69 GiB (GPU 0； 8.00 GiB total capacity...略

Anaconda镜像安装Pytorch--GPU版 （Windows系统）

发表评论

推荐文章

priority_queue的使用与模拟实现

软件测试Bug评测 之Serverity(严重程度)、Priority(优先级)

苹果主题商店_【App】Hellokitty主题APP推荐（含手游）

Android 打开应用商店评分

Ubuntu20.04双系统安装配置

热门文章

c++优先队列(priority_queue)用法详解

Kali Linux 如何使用 软件商店

Linux--Linux的应用市场：yum

爱思服务器可以下小组件,ios14怎么添加小组件

硬件中控一键开关机设计方案

windows 下 docker 运行 ubuntu 镜像

QQ浏览器按F12调开发人员工具问题

HP 战66笔记本重装WIN10前的BIOS设置

腾讯、抖音、陌陌们都在关注视频社交，可能找错了未来社交的方向

ASP.NET-Microsoft.Management.Infrastructure错误

最新文章

WIFI的配网方式

计算机wifi命令,一个超强大的技能|一个命令查看所有WiFi密码

cmd开无线服务器,使用cmd命令开启wifi

Scractch3.0_Arduino_ESP32_图形化编程学习_WIFI一键配网web（五）

ubuntu server 20.04 配置无线wifi网络并设置固定ip公司连接家里的linux服务器配置

协成智能wifi系统,协成智慧无线WiFi,路由器云端控制系统完全免费下载

易语言路由器服务器,无线路由器一键设置工具，制作过程，成品。

关于启动自动执行bat连wifi

wifi一键配网smartconfig原理及应用

ESP8266-12F一键配网（SmartConfig）+EEPROM储存密码（基于ArduinoIDE）

通过windows命令行共享wifi,一键启动脚本

无线设置 用户_无线WiFi远距离无线蹭网怎么中继桥接组网【详细介绍】

qca4004 linux wifi,物联网 WIFI 一键配置原理（smartconfig) ESP8266QCA4004

chatgpt赋能python：Python强解WiFi密码：一种简单而有效的方式

2小时破解WIFI密码！WPS漏洞目前尚无解决方案

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Pytorch "cuda runtime error (38) : no CUDA-capable device is detected”报错解决

Anaconda镜像安装Pytorch--GPU版（Windows系统）

软件测试Bug评测之Serverity(严重程度)、Priority(优先级)

Kali Linux 如何使用软件商店

无线设置用户_无线WiFi远距离无线蹭网怎么中继桥接组网【详细介绍】

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载