数值算法:无约束优化之一维搜索方法之多维优化问题中每步迭代的最优学习率设定问题

多维优化问题的迭代求解算法中,经常遇到学习率(步长)参数问题,比如线性分类器。一般如果采用固定学习率,那么算法收敛将比较慢,为了提高收敛速度往往需要不断调整学习率。一般多维优化问题中的迭代算法中的迭代公式为:

xk+1=xk+rdk

其中 xk 从给定的初始搜索点 x0 迭代,rk>=0为第k次迭代的学习率或步长,迭代目的是寻找最优解x*,使得代价函数 J(x) 最小,dk表示搜索方向,下面讨论学习率最优值问题, 定义:

hk(r)=  J(xk + r*dk)  = J(xk+1) 而 J(x) = J(xk) + delta<J(xk)>T(x-xk) + 1/2 * (x-xk)TH(x-xk)

因此 hk(r) = J(xk+1) = J(xk) + r* delta<J(xk)>Tdk+ 1/2 * r2 *(dk)T H dk

hk(r)表示当前所选的学习率 r 使得下一次迭代xk+1 取得的成本函数值,显然所选取的 r,应使得J(xk+1)尽可能的小,换句话说第 k 次迭代选取的最优 r* 应该使得J(xk+1)最小。H 是海森矩阵,J(x)在 xk 处的二阶偏导。delta<J(xk)>是J(x)在 xk 处的梯度。这是个一维优化问题:

h‘k(r) = delta<J(xk)>dk + r*(dk)T H dk=0

r= - delta<J(xk)>dk /  (dk)T H dk

特别地当dk= delta<J(xk)> 时,r为梯度下降法每步迭代的最优学习率或步长。

在实际的多维优化中,这种每次求解最优学习率的方法一般很少使用,因为需要将更多的计算资源配置到多维优化算法中而不是追求高精度的学习率,因此应该为每一步中最优学习率的搜索设定一个停止条件。

Armijo-Goldstein条件:通常选定3个常数,0<ε<1, ε<η<1,要求:

(1) hk(r) <=hk(0) + εrh‘k(0) ,保证学习率r不会太大;

(2)hk(r) >=hk(0) + ηrh‘k(0) , 保证学习率不会太小。

在多维优化问题中,对于每次迭代中的步长或学习率选择方法为:

一开始先为 r 选定一个备选值,如果能够满足(1),则选其为步长;否则,在该备选值上乘以一个系数 τ (0<τ<1),通常选τ=0.5,再次检验其是否能满足停止条件,以此类推直到选择出一个满足条件(1)的步长r。

时间: 2024-10-11 03:53:08

数值算法:无约束优化之一维搜索方法之多维优化问题中每步迭代的最优学习率设定问题的相关文章

数值算法:无约束优化之一维搜索方法之黄金分割法、斐波那契数列法

目标函数为一元单值函数f:R->R的最小化优化问题,一般不会单独遇到,它通常作为多维优化问题中的一个部分出现,例如梯度下降法中每次最优迭代步长的估计. 一维搜索方法是通过迭代方式求解的,这不同于我们人脑的直接通过解表达式求解方法.迭代算法是从初始搜索点x(0)出发,产生一个迭代序列x(1),x(2),....在第k=0,1,2,...次迭代中,通过当前迭代点x(k)和目标函数 f 构建下一个迭代点x(k+1).某些算法可能只需要用到迭代点处的目标函数值,而另一些算法还可能用到目标函数的导数 f'

数值算法:无约束优化之一维搜索方法之二分法、牛顿法、割线法

1.二分法(一阶导) 二分法是利用目标函数的一阶导数来连续压缩区间的方法,因此这里除了要求 f 在 [a0,b0] 为单峰函数外,还要去 f(x) 连续可微. (1)确定初始区间的中点 x(0)=(a0+b0)/2 .然后计算 f(x) 在 x(0) 处的一阶导数 f'(x(0)), 如果 f'(x(0)) >0 , 说明极小点位于 x(0) 的左侧,也就是所,极小点所在的区间压缩为[a0,x(0)]:反之,如果 f'(x(0)) <0,说明极小点位于x(0)的右侧,极小点所在的区间压缩为[x

数值算法:无约束优化之一维搜索方法之划界法寻找极小点上下界

前面介绍的黄金分割法.斐波那契数列法.二分法.牛顿法.割线法寻找极小点方法的前提是: 给定初始区间,它包含一个单峰的f(x). 如何寻找这个初始区间? 划界法:(挑选一个含有极小点的区间) 随机挑选3个点x1.x2.x3, 如果 f(x2)<f(x1) 且 f(x2)<f(x3) ,那么 [x1, x3]包含极小点.如果f(x1)>f(x2)>f(x3),那么选择一个点x4,x4>x3, 使得 f(x2) <f(x4)成立,这样[x1, x4]包含极小点.如果f(x1)

无约束优化方法

本文讲解的是无约束优化中几个常见的基于梯度的方法,主要有梯度下降与牛顿方法.BFGS 与 L-BFGS 算法,无约束优化的问题形式如下,对于 $x \in \mathbb{R}^n$ ,目标函数为: \[\min_xf(x)\] 泰勒级数 基于梯度的方法都会涉及泰勒级数问题,这里简单介绍一下,泰勒级数就是说函数 $f(x)$ 在点 $x_0$ 的邻域内具有 $n+1$ 阶导数,则该邻域内 $f(x)$ 可展开为 $n$ 阶泰勒级数为: \[f(x) = f(x_0) + \nabla f(x_0

&lt;28&gt;【了解】10-枚举类型介绍及定义+【掌握】11-枚举变量变量定义和使用+【掌握】13-typedef定义新的类型+【掌握】15-宏的概念及无参宏定义方法+【掌握】16-有参宏定义和使用方法+【掌握】17-应用:使用有参宏求最大值+【掌握】18-typedef和#define的区别

[了解]10-枚举类型介绍及定义 枚举类型: C语言提供了一个种类型,这种类型的变量的取值被限定在一定的范围之内了 枚举类型的定义: enum 枚举类型名{ 枚举值1,枚举值2,.... }; 举例: 定义一个变量,保存一周的第几天 enum weekday{ zhouyi,zhouer,zhousan,zhousi,zhouwu ,zhouliu,zhouri }; 定义iPhone手机的颜色 关于枚举类型元素的命名习惯 enum iColor{kIcolorWhite,kIcolorBlac

virtualbox共享文件夹无访问权限问题解决方法

早就困扰了,这次新装虚拟机又碰到了,记录下来. 这篇文章主要介绍了virtualbox共享文件夹无访问权限问题解决方法,造成这个问题的原因是不跟virtualbox在同一个用户组,所以加入同个组即可解决这个问题,需要的朋友可以参考下virtualbox的共享文件夹一般都挂载在/media下面,用ll查看会发现文件夹的所有者是root,所有组是vboxsf,所以文件管理去无法访问是正常的,解决方法是把你自己加入到vboxsf组里面. 复制代码代码如下:sudo usermod -a -G vbox

eclipse插件Maven添加依赖查询无结果的解决方法(Select Dependency doesn&#39;t work)

在eclipse中用过maven的可能都遇到过这种情况,我以前一直在search.maven里面搜索,然后添加pom信息. 今天在网上搜索时,找到了一个解决方法,在这里分享一下. 第一步,在preferences里面选择maven,选中"Download repository index updates on startup" 第二步,打开Maven仓库 第三步,在全局仓库上右键选择"Full Index Enabled" 选择之后,maven会下载一个近百兆的索引

源码解析一种无模块注入进程方法

对windows安全比较熟悉的同学对模块注入应该都比较了解,很多病毒.木马.外挂都会用到,无模块注入应用得则比较少. 无模块注入的好处是DLL注入进去后,确实已经不以模块的形式存在了,用任何进程模块查看工具,都找不到注入进去的DLL.因为它已经变为一块纯堆内存,跟EXE主模块里申请的堆没有任何差别. 这里讲的一种无模块注入的方法,能够让DLL自身实现这样的功能,无需外部注入工具帮助处理.当然如果进程内自行加载这样的DLL后,也是以无模块DLL形式存在. 注入完成后,进程内找不到注入的模块存在,用

类的无参带参方法

类的无参方法 1.什么是类的方法 类是由一组具有相同属性和共同行为的实体抽象而来的,对象执行的操作是通过编写类的方法实现的. 2.如何定义类的方法 类的方法必须包括以下三个部分: ① 方法的名字 ②方法的返回值类型 ③方法的主体 语法:   public 返回值类型  方法名(){ //方法的主体 } 编写方法时,分两步完成: 第一步:定义方法名和返回值.    第二步:在{}中编写方法的主题部分. 但要注意一下三点:① 方法体放在一对大括号中,方法体就是一段程序代码,完成一定的工作. ②方法名