基于下界函数的最优化

编程入门 行业动态 更新时间:2024-10-23 13:22:03

基于<a href=https://www.elefans.com/category/jswz/34/1731471.html style=下界函数的最优化"/>

基于下界函数的最优化

点击上方“大数据与人工智能”,“星标或置顶公众号”

第一时间获取好内容


作者丨stephenDC

这是作者的第12篇文章



导语


生活中我们处处面临最优化的问题,比如,怎么样一个月减掉的体重最高?怎么样学习效率最高?怎么样可以最大化实现个人价值?

 

显然,每一个目标都受很多因素的影响,我们称之为目标函数的最优化。


优化的思路有很多种,比如基于梯度的梯度下降,基于二阶梯度的牛顿法,基于近似的二阶梯度的拟牛顿法,基于下界函数的最优化,贪婪算法,坐标下降法,将约束条件转移到目标函数的拉格朗日乘子法等等。




本文我们讨论一下基于下界函数的最优化,且将讨论的范围限定为无约束条件的凸优化。


基于下界函数的优化


在有些情况下,我们知道目标函数的表达形式,但因为目标函数形式复杂不方便对变量直接求导。这个时候可以尝试找到目标函数的一个下界函数,通过对下界函数的优化,来逐步的优化目标函数。

       

       

                           

上面的描述性推导很是抽象,下面我们来看两个具体的例子,EM算法和改进的迭代尺度法。限于篇幅,我们重点推导EM算法,改进的迭代尺度法只是提及一下。


EM算法

       

       

                    

              

                     

             

改进迭代算法


概率模型中最大熵模型的训练,最早用的是通用迭代法GIS(Generalized Iterative Scaling)。GIS的原理很简单,大致包括以下步骤:


  • 假定初始模型(第0次迭代)为等概率的均匀分布。

  • 用第k次迭代的模型来估算每种信息特征在训练数据中的分布,如果超过了实际的,就把相应的模型参数变小;反之,将参数变大。

  • 重复步骤2,直到收敛。


GIS算法,本质上就是一种EM算法,原理简单步骤清晰,但问题是收敛太慢了。Della Pietra兄弟在1996年对GIS进行了改进,提出了IIS(Improved Iterative Scaling)算法。IIS利用log函数的性质,以及指数函数的凸性,对目标函数进行了两次缩放,来求解下界函数。详情可参阅李航的《统计学习方法》一书。

 


小结


本文讨论了一下基于下界函数的最优化这样一种优化思路,希望对大家有所帮助。同时也一如既往地欢迎批评指正,以及大神拍砖。



-end-


更多推荐

基于下界函数的最优化

本文发布于:2023-07-28 21:06:36,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1319393.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:下界   函数   最优化

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!