线性搜索简介

Numerical Optimization Line Search

数值优化是迭代式的优化方法,从一个初始点x0开始,然后产生一个迭代方向?d0,在这个方向上选择一个步长α0,下一个点就是x0+α0??d0。
按照这样的方法不停的迭代下去,直到找到最优点。在这个过程中有两步是非常重要的。第一步就是计算出迭代方向?dk,第二步是在这个方向上选择合适的步长 αk,获得下一个点xk+1。
第一步产生迭代方向 ?dk 是各种优化方法产生差别的地方,不同的方法有不同的方法生成迭代方向。但是对于不同的迭代方法都有一个最基本的要求,那就是这个方向必须是一个下降方向:?f(xk)T??dk<0。其中?f(xk) 是 xk 的梯度方向。

第二步称为线性搜索。在这个步骤上不同的方法基本都是相同的。在线性搜索方法中有两个比较重要的部分,首先是停止条件,第二个是步长选择算法。之所以要求满足停止条件而不是仅仅要求函数值有下降,是为了确保优化算法能够正常的收敛。
线性搜索问题可以如下形式化:

argminxf(xk+1)=f(xk+α??x)
s.t.α≥0
终止条件

首先假设当前点 xk 的梯度是 ?f(xk),当前的迭代方向是 ?dk,并且满足 ?f(xk)T??dk<0,并且当前的选择的步长为 α0。

Sufficient Descreasement Condition

这个条件也称为Armijo Condition,描述如下:

f(xk+α0?dk)≤f(xk)+α0?ρg(xk)T?dk
0<ρ<1/2
其中 ρ 是用户指定的参数,一般来说这个参数的数量级大概为1e?3 或者更低。但是仅仅使用这个条件并不能确保优化过程收敛。
但是当这个条件配合backtracking搜索方法的时候可以确保优化过程收敛。

Curvature Condition

?f(xk+α0?dk)T?dk≥δ?f(xk)T?dk
s.tρ<δ<1
对于delta的取值一般比较大,比如0.8,0.9等等。这个值越大,对应的搜索越不精确。

Wolfe Condition

Wolfe Condition就是把Sufficient Decreasement Condition和curvature condition合并在一起,表述如下:

f(xk+α0??dk)≤f(xk)+ρα0f(xk)T?dk
?f(xk+α0?dk)T?dk≥δ?f(xk)T?dk
s.t0<ρ<δ<1
一般来说Wolfe Condition是用于拟牛顿方法。

Strong Wolfe Condition

f(xk+α0??dk)≤f(xk)+ρα0f(xk)T?dk
∣∣?f(xk+1)T?dk∣∣≤δ∣∣?f(xk)T?dk∣∣
s.t0<ρ<δ<1
Goldstein Condition

f(xk+α0?dk)≤f(xk)+α0?ρg(xk)T?dk
f(xk+α0?dk)≥f(xk)+α0?(1?ρ)g(xk)T?dk
s.t.0<ρ<1/2
步长选择

这个一般可以使用多种不同的方法来选择,对于我来说还是喜欢用backtracking方法,主要的原因是这个方法比较简单且容易实现。而且可以配合多种不同的终止条件。

backtracking

backtracking基本来说是从某个步长开始,然后不停的缩小步长。知道找到满足终止条件的步长。

function [retval] = backtrack(x0, d0, f, c1, c2)
%line search algorithm based on backtracking to find point satisfy strong wolfe condition
% x0 : current point
% d0 : search direction
% f : function will return value and gradient, [f, g] = f(x);
% 0 < c1 < c2 < 1

[f0, grad] = f(x0);
slope = grad‘ * d0;

if slope >= 0
error(‘must be a descent direction‘)
end

alpha0 = 0;
alphaMax = 1e2;

alpha = 1;
dec = 0.5;
inc = 2.1;

while 1

  [current_val, current_grad] = f( x0 + alpha * d0);
  factor = 1;

 if current_val > ( f0 + alpha * c1 * slope)
    factor = dec;
 else
  current_slope = current_grad‘ * d0;

  if current_slope < c2 * slope
    factor = inc;
  else
      if current_slope > -c2*slope
     factor = dec;
      else
      break;
      end
  end
  end

  if alpha < 1e-15
    warning(‘too small step size‘)
  end

  if alpha > alphaMax
 warning(‘too large step size‘)
  end

  alpha = alpha * factor;

end
retval = alpha;
end
总结

线性搜索的性能对优化问题至关重要,简单且可靠的线性搜索方法可以解决很多的问题。一般来说,Goldstein条件适用于牛顿饭,Wolfe和strong Wolfe条件适用于拟牛顿法

线性搜索简介

时间: 2024-07-29 12:12:10

线性搜索简介的相关文章

双目视觉算法简介

http://blog.csdn.net/u010784534/article/details/50437612 转载自:http://blog.sina.com.cn/s/blog_4a540be60102v44s.html 1. 双目视觉算法简介 1.1. 双目视觉简介 双目视觉广泛应用在机器人导航,精密工业测量.物体识别.虚拟现实.场景重建,勘测领域. 什么是双目视觉? 双目视觉是模拟人类视觉原理,使用计算机被动感知距离的方法.从两个或者多个点观察一个物体,获取在不同视角下的图像,根据图像

Android网络通讯简介

网络通信应该包含三部分的内容:发送方.接收方.协议栈.发送方和接收方是参与通信的主体,协议栈是发送方和接收方进行通信的契约.按照服务类型,网络通信可分为面向连接和无连接的方式.面向连接是在通信前建立通信链路,而通信结束后释放该链路.无连接的方式则不需要在通信前建立通信连接,这种方式不保证传输的质量. Android提供了多种网络通信的方式,如Java中提供的网络编程,在Android中都提供了支持.Android中常用的网络编程方式如下: 针对TCP/IP协议的Socket和ServerSock

微信红包的架构设计简介

@来源于QCon某高可用架构群整理,整理朱玉华. 背景:有某个朋友在朋友圈咨询微信红包的架构,于是乎有了下面的文字(有误请提出,谢谢) 概况:2014年微信红包使用数据库硬抗整个流量,2015年使用cache抗流量. 微信的金额什么时候算? 答:微信金额是拆的时候实时算出来,不是预先分配的,采用的是纯内存计算,不需要预算空间存储.. 采取实时计算金额的考虑:预算需要占存储,实时效率很高,预算才效率低. 实时性:为什么明明抢到红包,点开后发现没有? 答:2014年的红包一点开就知道金额,分两次操作

JSON 简介

ylbtech-JSON: JSON 简介 JSON:JavaScript Object Notation(JavaScript 对象表示法) JSON是存储和交换文本信息的语法,类似 XML. JSON 比 XML 更小.更快.更易解析. JSON 实例 { "employee":[ {"firstName":"John","lastName":"Doe"}, {"firstName"

Docker简介

Docker简介 什么是Docker: 正所谓Docker的英文本意为"搬运工",所以在我们的世界里,可以理解为Docker搬运的是装满任意类型的APP的集装箱,开发者可以通过Docker将APP变成一种标准化的.可移动植的.自动管理的组件.它用一种新的方式实现了轻量级的虚拟机,专业术语成为应用容器(Application Container) Docker的优势: 1.利用率高 ·Docker对系统资源的利用率很高,一台主机可以同时运行数千个Docker容器 2.可以快速的交付应用程

kafka入门:简介、使用场景、设计原理、主要配置及集群搭建(转)

问题导读: 1.zookeeper在kafka的作用是什么? 2.kafka中几乎不允许对消息进行"随机读写"的原因是什么? 3.kafka集群consumer和producer状态信息是如何保存的? 4.partitions设计的目的的根本原因是什么? 一.入门 1.简介 Kafka is a distributed,partitioned,replicated commit logservice.它提供了类似于JMS的特性,但是在设计实现上完全不同,此外它并不是JMS规范的实现.k

Quartz.NET简介及入门指南

Quartz.NET简介 Quartz.NET是一个功能完备的开源调度系统,从最小的应用到大规模的企业系统皆可适用. Quartz.NET是一个纯净的用C#语言编写的.NET类库,是对非常流行的JAVA开源调度框架 Quartz 的移植. 入门指南 本入门指南包括以下内容: 下载 Quartz.NET 安装 Quartz.NET 根据你的特定项目配置 Quartz 启动一个样例程序 下载和安装 你可以下载 zip 文件或使用 Nuget 程序包.Nuget 程序包只包含 Quartz.NET 运

ASP.Net简介、IIS服务器和Repeater重复器

简介:ASP.NET - 制作网站应用程序的技术 WebForm -出来时间比较早,敏捷.便捷开发,封装一些控件,慢慢发现一些控件做的挺好,真正使用没有那么敏捷 MVC -出来时间比较晚 什么东西? winform 界面 - 后台 - 数据库 共同组合出来的程序:ASP.NET 界面(HTML+CSS+JS) - 后台 - 数据库 运行机制:winform - 程序是安装在用户的电脑上,程序是运行在用户电脑上的.net Framework框架上的 ASP.NET - 通过浏览器向服务器发送请求,

CloudFoundry in 1 Box简介:PCF-Dev篇

在<CloudFoundry in 1 Box简介:Bosh-lite篇>我们介绍了Bosh-lite的架构和部署.在本篇中,我们将详细描述另一个CloudFoundry in 1 Box解决方案PCF-Dev. 1PCF-dev简介 PCF是Pivotal发行的Cloud Foundry商业版,PCF-Dev原名MicroPCF,是Pivotal为PCF的应用开发人员准备的一款App单虚拟机版的CloudFoundry.但是,麻雀虽小,五脏俱全.PCF-Dev虽然可以在仅仅一台虚拟式上即可运