论文总结：Estimating or Propagating Gradients Through Stochastic Neurons for Conditional Computation|电子爱好者

admin管理员组
文章数量:1614169

论文地址：https://arxiv/pdf/1308.3432.pdf

主要内容

许多基于神经网络或深度学习的算法都是依赖于梯度的学习，为此需要平滑的网络来计算梯度，但这种想法并不正确。引入扰动可以获得估计的梯度。

像有限差分近似这种独立扰动计算低效，因此需要引入随机扰动。

那么好的梯度估计值是否可以进行计算和训练？

基于这一问题，作者讨论了四种方案：

Noisy Rectifier
STS Units: Stochastic Times Smooth
Straight-Through EstimatorStraight-Through Estimator
Conditional Computation Experiments

考虑神经元的输出 h i h_i hi：

其中， h i h_i hi是确定的函数。 a i a_i ai是可微的变换， z i z_i zi是噪声源。令 a i a_i ai为：

其中， x i x_i xi是输入。
如果 z i z_i zi是加性或乘性的噪声，梯度可以被正常的计算；但如果 z i z_i zi是二元的，f的梯度几乎处处为0。为此，需要对f进行选择，使得梯度分为两个区域：等于0的不敏感区域和不等于0的敏感区域。

1.Noisy Rectifier

令不敏感状态对应于 h i = 0 h_i=0 hi=0：

其中， z i z_i zi为零均值噪声，来自于如下函数：

该整流器有如下性质：

因此，当 f ( a i , 0 ) > 0 f(a_i,0) >0 f(ai,0)>0，神经元处于活动状态，就能被正常激活；少数情况下(负噪声很大)也会不活跃。
当 f ( a i , 0 ) = 0 f(a_i,0)=0 f(ai,0)=0，神经元处于不活跃状态，但是噪声很大时也会被激活，这时如果被激活是好事，则会增加总权重使得被激活概率增加；反之，如果不是好事，则减小权重使得被激活概率减少。

但是，神经元的敏感和不敏感状态的概率是不同的(实际上可能多数情况都处于不敏感状态)，为此需要一个机制使得二者概率相同，如设置阈值。

2.STS Units: Stochastic Times Smooth

STS的输出如下：

其性质和证明如下：

上述结论可推广到任意情况下的f(x)的泰勒展开：

3.Unbiased Estimator of Gradient for Stochastic Binary Neurons

过于复杂，有兴趣再看。

4.Straight-Through Estimator

其思想为通过硬阈值函数反向传播(参数为正则输出1，否则输出0)。
h i h_i hi取样于：

则关于 a i a_i ai的损失函数L的梯度的直通估计量为：

实验

本文标签：论文 Propagating Estimating Gradients Computation

版权声明：本文标题：论文总结：Estimating or Propagating Gradients Through Stochastic Neurons for Conditional Computation 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1725806936a1044152.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

论文总结：Estimating or Propagating Gradients Through Stochastic Neurons for Conditional Computation

主要内容

1.Noisy Rectifier

2.STS Units: Stochastic Times Smooth

3.Unbiased Estimator of Gradient for Stochastic Binary Neurons

4.Straight-Through Estimator

实验

更多相关文章

基于SSM的献血管理系统设计与实现(论文+源码)_kaic

武利中学校园网络规划与设计(论文+源码)

（springboot+小程序）心理疗愈 毕业设计源码论文+答辩PPT

【论文阅读】TRO 2021: Fail-Safe Motion Planning for Online Verification of Autonomous Vehicles Using Conve

深度学习论文阅读目标检测篇（一）：R-CNN《Rich feature hierarchies for accurate object detection and semantic...》

2023年系统分析师论文模拟题--押题

【论文笔记】Learning Distinctive Margin toward Active Domain Adaptation(CVPR 2022)

2022年6月 Frontier 获得性能第一的论文翻译

顶会论文阅读总结1——Exposing the Rat in the Tunnel: Using Traffic Analysis for Tor-based Malware Detection

基于Java的学生资助管理系统的设计与实现(源码+论文)

看了几十篇轻量化目标检测论文扫盲做的摘抄笔记

论文阅读——A Disentangling Invertible Interpretation Network for Explaining Latent Representations

如何自动生成推荐歌单：ACM论文翻译与解读 | Translation and Interpretation of ACM Survey

笔记3（总结）-THE TUH EEG CORPUS: A Big Data Resource for Automated EEG Interpretation（论文）

遥感领域多模态综述论文翻译

【时间序列】KDD 2021丨时间序列相关研究论文汇总

CVPR2020论文和代码整理链接

论文点云：基于深度学习的点云分类和切割

相对位置编码之RPR式：《Self-Attention with Relative Position Representations》论文笔记

论文笔记 | The Fundamental Matrix: Theory, Algorithms, and Stability Analysis

发表评论

推荐文章

心电图算法整理

resnet18实战宝可梦精灵

惠普笔记本电脑触控板不可用解决办法

Ubuntu16.04 安装后配置系列(二)，Python3.6、tensorflow-gpu，OpenCV等

前端uni-app检测手机系统是iOS还是android(可实现根据手机系统跳转App下载链接)

热门文章

按键精灵脚本简单介绍

容易忽视的CSS3粘性定位position sticky

iMac2021 在重新安装mac os系统后，电脑账户创建失败

Matplotlib绘图显示缺少中文字体－RuntimeWarning: Glyph 8722 missing from current font.

Viz World and Viz Curious Maps 教程 -- 基础篇

盘点各国自己开发的操作系统

Chrome浏览器开机启动并全屏打开指定页面

android 使用系统下载并更新版本,安卓系统更新升级的种方法

手机版本android升级包下载,安卓7.0通用升级包安装

ubuntu下深度启动盘制作工具

最新文章

deepin启动盘无法引导安装_深度启动盘制作工具(Deepin Boot Maker)怎么安装kubuntu?Deepin Boot Maker图文教程...

制作深度linux优盘,制作Linux的优盘（usb）启动盘

dmg写入u盘_轻松教大家用U盘安装Mac OS10.14.1双系统

u盘深度linux安装教程,U盘安装

deepin系统15.6版本安装执行那个exe文件_Ventoy – 开源 U 盘启动盘制作工具，U盘安装系统工具...

制作Windows和Linux二合一维护U盘

win7 linux启动设置u盘启动,在linux下怎么样制作win7的U盘启动？

u盘启动linux只有光标闪烁,deepin官方论坛-深度科技官网旗下网站

没有u盘安装深度linux系统下载地址,关于deepin 20bate无法正常使用U盘安装的问题...

记录manjaro linux的U盘安装过程

redhat安装wine教程_超简单制作多合一系统安装启动U盘的工具

如何用u盘安装深度linux系统,如何安装Deepin国产操作系统？只需一个U盘就够了，超简单...

探索高效U盘生产的秘密武器：慧荣U盘量产工具 v20.02.04.21

linux deepin桌面版boot,deepin 深度启动盘制作工具 （Deepin Boot Maker）

deppin 15 u盘制作

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

（springboot+小程序）心理疗愈毕业设计源码论文+答辩PPT

linux deepin桌面版boot,deepin 深度启动盘制作工具（Deepin Boot Maker）

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载