深度学习优化算法大全系列6:Adam|电子爱好者

admin管理员组
文章数量:1642443

1.Adam是啥

前面铺垫了这么多，终于铺垫到Adam了。作为最常用的优化器之一，很多同学可能都听说过Adam的名字，但是Adam是什么意思可能并不清楚。Adam其实包括两部分：Ada+M。其中，Ada就是我们前面提到的Adaptive，而M是我们一直在讲的Momentum。

结合我们前面提到的内容，SGD中的一阶动量计算方式：
m t = β 1 m t − 1 + ( 1 − β 1 ) g t m_t = \beta_1 m_{t-1} + (1-\beta_1)g_t mt=β1mt−1+(1−β1)gt
而在AdaDelta中，二阶动量为
V t = β 2 V t − 1 + ( 1 − β 2 ) g t 2 V_t = \beta_2 V_{t-1} + (1-\beta_2)g_t^2 Vt=β2Vt−1+(1−β2)gt2

2.结合源码分析

class Adam(Optimizer):
  """Adam optimizer.

  Default parameters follow those provided in the original paper.

  Arguments:
      lr: float >= 0. Learning rate.
      beta_1: float, 0 < beta < 1. Generally close to 1.
      beta_2: float, 0 < beta < 1. Generally close to 1.
      epsilon: float >= 0. Fuzz factor. If `None`, defaults to `K.epsilon()`.
      decay: float >= 0. Learning rate decay over each update.
      amsgrad: boolean. Whether to apply the AMSGrad variant of this algorithm
        from the paper "On the Convergence of Adam and Beyond".
  """

  def __init__(self,
               lr=0.001,
               beta_1=0.9,
               beta_2=0.999,
               epsilon=None,
               decay=0.,
               amsgrad=False,
               **kwargs):
    super(Adam, self).__init__(**kwargs)
    with K.name_scope(self.__class__.__name__):
      self.iterations = K.variable(0, dtype='int64', name='iterations')
      self.lr = K.variable(lr, name='lr')
      self.beta_1 = K.variable(beta_1, name='beta_1')
      self.beta_2 = K.variable(beta_2, name='beta_2')
      self.decay = K.variable(decay, name='decay')
    if epsilon is None:
      epsilon = K.epsilon()
    self.epsilon = epsilon
    self.initial_decay = decay
    self.amsgrad = amsgrad
...

以上为tensorflow中Adam的源码。可以看出， β 1 , β 2 \beta_1, \beta2 β1,β2等参数值均按原始论文给出。

l r lr lr:学习率，默认值0.001
β 1 \beta_1 β1:控制一阶动量，默认值0.9
β 2 \beta_2 β2:控制二阶动量，默认值0.999
ϵ \epsilon ϵ: Fuzz factor，默认值1e-7

到此为止，我们平时常用的 β 1 , β 2 \beta_1, \beta_2 β1,β2参数是彻底搞清楚具体什么意思了。

本文标签：算法深度系列大全 Adam

版权声明：本文标题：深度学习优化算法大全系列6:Adam 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1729341037a1197538.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

深度学习优化算法大全系列6:Adam

1.Adam是啥

2.结合源码分析

更多相关文章

共享游戏后游戏显示不了怎么办？steam共享游戏库看不到游戏解决方法大全

python游戏代码大全可复制,python最简单游戏代码

赛车游戏代码大全html,赛车游戏代码

python游戏代码大全可复制,python简单的小游戏代码

android html5小游戏源代码,HTML5小游戏源代码大全（300M）

android html5小游戏源代码下载,HTML5小游戏源代码大全

Python常用第三方库大全, 值得收藏!

1000+常用Python库大全，太实用了！

tinkerboard2 Android11系列-4G模组调试

ADB命令使用大全及使用原理

Office 2016系列下载地址

Office 365 On MacOS 系列——安装 Office 2016 for Mac

利用OpenSSL，用国密SM4算法来给文件加密、解密

linux下用openssl的RSA算法对文件加密解密

网管技能之【Windows】攻略大全

Junit5系列-Junit5中@Disabled禁止执行

新浪邮箱发信php源码,Winmail退信分析大全

菜鸟系列Fabric源码学习 — 区块同步

数据结构与算法分析——第3章考试题

Python模块 matplotlib功能与使用方法大全

发表评论

推荐文章

基于加密软件的加密和解密

java: JPS incremental annotation processing is disabled||java: java.lang.ExceptionInInitializer IDEA

socket发送数据与接收数据

解决cordova报错： Failed to execute ‘send‘ on ‘WebSocket‘: Still in CONNECTING

firewall-cmd 常用命令

热门文章

计算机本地网络给手机使用吗,手机网络也能共享给电脑（台式or笔记本）使用吗？...

visio和office2016安装记录

ip-guard文档透明加密、只读加密、智能加密和只解密不加密有什么区别？

linux基础的一些常见问题总结_学习笔记

WSL2之docker编译android12报错：Build sandboxing disabled due to nsjail error(六十九)

layui的树怎么动态的设置禁用的disabled属性

java: JPS incremental annotation processing is disabled||java: java.lang.ExceptionInInitializer IDEA

exception

英语四级万能写作模板

Photoshop CS6将多张图片合成GIF动态图或视频，并将其保存导出

最新文章

【win11】解决win11家庭版没有组策略编辑器

win11关闭Hyper-V

VirtualBox 安装 win11 虚拟机

win11文件访问被拒绝解决方法win11不能修改c盘文件修改权限的解决办法

win11安装虚拟机

Win11文件类型怎么改？Win11修改文件后缀的方法

win11toast：python桌面通知工具

Win11高效日历推荐(六十六)

win11多桌面功能怎么使用 win11多桌面设置步骤

Win11动态磁贴没了？Win11中恢复动态磁贴的方法

Win11系统更新后任务栏不见了怎么恢复？Win11任务栏不见了恢复方式最新分享

win11磁盘分区_win11系统磁盘如何分区

win11桌面一直刷新闪屏无法操作怎么办？快速排查并修复Win11中的屏幕闪烁问题

延迟win11的更新

Win11怎么共享文件夹？Win11创建共享文件夹的方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载