鞍点和极大极小理论

  设$\phi:
X \times Z \mapsto
R$是闭凸函数,其中$X$和$Z$分别是$\mathbb{R}^n$和$\mathbb{R}^m$的非空子集,考虑如下的极大极小问题:\begin{align*}\min_{\boldsymbol{x}}
& \ \sup_{\boldsymbol{z} \in Z} \phi(\boldsymbol{x}, \boldsymbol{z})
\\ \mbox{s.t.} & \ \boldsymbol{x} \in X. \end{align*}和\begin{align*}
\max_{\boldsymbol{z}} & \ \inf_{\boldsymbol{x} \in X}
\phi(\boldsymbol{x}, \boldsymbol{z}) \\ \mbox{s.t.} & \ \boldsymbol{z}
\in Z.
\end{align*}那么一个最直接的问题就是在什么条件下有如下的极大极小等式\begin{align}
\label{equ: minimax problem} \sup_{\boldsymbol{z} \in Z}
\inf_{\boldsymbol{x} \in X} \phi(\boldsymbol{x}, \boldsymbol{z}) =
\inf_{\boldsymbol{x} \in X} \sup_{\boldsymbol{z} \in Z}
\phi(\boldsymbol{x}, \boldsymbol{z})
\end{align}成立,且相应的极值都能取到。极大极小问题是一个很普遍的问题,下面给出两个例子:

  1. 考虑如下只有两个玩家的零和博弈,其中玩家A有$n$个策略,玩家B有$m$个策略,若玩家A选择策略$i$的同时玩家B选择策略$
    j
    $,则玩家A需支付$a_{ij}$的报酬给玩家B,玩家A的目标就是最小化他支付的报酬,玩家B的目标就是最大化他得到的报酬。不妨设他们都采用混合策略,即玩家A按概率分布$\boldsymbol{x}
    = (x_1,\dots,x_n)$选择策略,玩家B按概率分布$\boldsymbol{z} =
    (z_1,\dots,z_m)$选择策略,那么玩家A的期望支付报酬就是\begin{align*} \sum_{i=1}^n
    \sum_{j=1}^m a_{ij} x_i z_j = \boldsymbol{x}^\top \boldsymbol{A}
    \boldsymbol{z}, \end{align*}其中矩阵$\boldsymbol{A} \in \mathbb{R}^{n \times
    m}$第$i$行第$j$列的元素是$a_{ij}$。若每个玩家都考虑最坏的情况,即玩家A最小化$\max_{\boldsymbol{z}}
    \boldsymbol{x}^\top \boldsymbol{A}
    \boldsymbol{z}$,玩家B最大化$\min_{\boldsymbol{x}} \boldsymbol{x}^\top
    \boldsymbol{A}
    \boldsymbol{z}$,不难看出这两个问题就是上面的极大极小问题,在下一章我们将证明这两个问题的最优值是相等的。

  2. 考虑如下含有不等式约束的优化问题:\begin{align*}
    \min_{\boldsymbol{x}} & \ f(\boldsymbol{x}) \\ \mbox{s.t.} & \
    \boldsymbol{x} \in X, \boldsymbol{g}(\boldsymbol{x}) \leq
    \boldsymbol{0}. \end{align*}其中$X$是$\mathbb{R}^n$的非空子集,$f: \mathbb{R}^n
    \mapsto \mathbb{R}$,$g_j: \mathbb{R}^n \mapsto
    \mathbb{R}$是给定函数。引入Lagrangian乘子得到如下形式的Lagrangian函数:\begin{align*}
    L(\boldsymbol{x}, \boldsymbol{\mu}) = f(\boldsymbol{x}) + \sum_{j=1}^r
    \mu_j g_j(\boldsymbol{x}).
    \end{align*}不难看出若$\boldsymbol{x}$破坏了某个约束,即若某个$g_j(\boldsymbol{x}) >
    0$,那么将有$\sup_{\boldsymbol{\mu} \geq \boldsymbol{0} } L(\boldsymbol{x},
    \boldsymbol{\mu}) =
    \infty$;若$\boldsymbol{x}$满足所有约束,将有$\sup_{\boldsymbol{\mu} \geq
    \boldsymbol{0} } L(\boldsymbol{x}, \boldsymbol{\mu}) =
    f(\boldsymbol{x})$,于是原问题可写为\begin{align*} \min_{\boldsymbol{x}} & \
    \sup_{\boldsymbol{\mu} \geq \boldsymbol{0} } L(\boldsymbol{x},
    \boldsymbol{\mu}) \\ \mbox{s.t.} & \ \boldsymbol{x} \in X.
    \end{align*}我们引入如下形式的对偶问题:\begin{align*} \max_{\boldsymbol{\mu}} & \
    \inf_{\boldsymbol{x} \in X} L(\boldsymbol{x}, \boldsymbol{\mu}) \\
    \mbox{s.t.} & \ \boldsymbol{\mu} \geq \boldsymbol{0}.
    \end{align*}那么极大极小问题实质上就是原始问题和对偶问题是否存在对偶间隙(duality
    gap),即极大极小等式(\ref{equ: minimax problem})是否成立。

  通过观察,不难发现对于$\forall
\bar{\boldsymbol{z}} \in Z$有\begin{align*}\inf_{\boldsymbol{x} \in X}
\phi(\boldsymbol{x}, \bar{\boldsymbol{z}}) \leq \inf_{\boldsymbol{x} \in
X} \sup_{\boldsymbol{z} \in Z} \phi(\boldsymbol{x},
\boldsymbol{z}).\end{align*}于是对再$\bar{\boldsymbol{z}}$取上确界有\begin{align*}\sup_{\boldsymbol{z}
\in Z} \inf_{\boldsymbol{x} \in X} \phi(\boldsymbol{x}, \boldsymbol{z})
\leq \inf_{\boldsymbol{x} \in X} \sup_{\boldsymbol{z} \in Z}
\phi(\boldsymbol{x}, \boldsymbol{z}).
\end{align*}故只需要研究在什么条件下有\begin{align*} \sup_{\boldsymbol{z} \in Z}
\inf_{\boldsymbol{x} \in X} \phi(\boldsymbol{x}, \boldsymbol{z}) \geq
\inf_{\boldsymbol{x} \in X} \sup_{\boldsymbol{z} \in Z}
\phi(\boldsymbol{x}, \boldsymbol{z}).
\end{align*}为此我们先引入鞍点(saddle
point)的概念,若向量$\boldsymbol{x}^* \in X$和$\boldsymbol{z}^* \in
Z$使得\begin{align*} \phi(\boldsymbol{x}^*, \boldsymbol{z}) \leq
\phi(\boldsymbol{x}^*, \boldsymbol{z}^*) \leq \phi(\boldsymbol{x},
\boldsymbol{z}^*), \ \forall \boldsymbol{x} \in X, \forall \boldsymbol{z}
\in Z. \end{align*}成立,则称$(\boldsymbol{x}^*,
\boldsymbol{z}^*)$为$\phi$的鞍点。由定义可知,$(\boldsymbol{x}^*,
\boldsymbol{z}^*)$为$\phi$的鞍点当且仅当$\boldsymbol{x}^* \in X$,$\boldsymbol{z}^*
\in Z$且\begin{align*} \sup_{\boldsymbol{z} \in Z} \phi(\boldsymbol{x}^*,
\boldsymbol{z}) = \phi(\boldsymbol{x}^*, \boldsymbol{z}^*) =
\inf_{\boldsymbol{x} \in X} \phi(\boldsymbol{x}, \boldsymbol{z}^*).
\end{align*}

  命题3.4.1:$(\boldsymbol{x}^*,
\boldsymbol{z}^*)$为$\phi$的鞍点当且仅当极大极小等式成立且$\boldsymbol{x}^*$是\begin{align}
\label{equ: saddle point a} \begin{split} \min_{\boldsymbol{x}} & \
\sup_{\boldsymbol{z} \in Z} \phi(\boldsymbol{x}, \boldsymbol{z}) \\
\mbox{s.t.} & \ \boldsymbol{x} \in X. \end{split}
\end{align}的最优解,$\boldsymbol{z}^*$是\begin{align} \label{equ: saddle point
b} \begin{split} \max_{\boldsymbol{z}} & \ \inf_{\boldsymbol{x} \in X}
\phi(\boldsymbol{x}, \boldsymbol{z}) \\ \mbox{s.t.} & \ \boldsymbol{z}
\in Z. \end{split} \end{align}的最优解。

  证明:一方面,若$\boldsymbol{x}^*$和$\boldsymbol{z}^*$分别是(\ref{equ:
saddle point a})和(\ref{equ: saddle point b})的最优解,那么\begin{align*}
\sup_{\boldsymbol{z} \in Z} \inf_{\boldsymbol{x} \in X}
\phi(\boldsymbol{x}, \boldsymbol{z}) = \inf_{\boldsymbol{x} \in X}
\phi(\boldsymbol{x}, \boldsymbol{z}^*) \leq \phi(\boldsymbol{x}^*,
\boldsymbol{z}^*) \leq \sup_{\boldsymbol{z} \in Z} \phi(\boldsymbol{x}^*,
\boldsymbol{z}) = \inf_{\boldsymbol{x} \in X} \sup_{\boldsymbol{z} \in Z}
\phi(\boldsymbol{x}, \boldsymbol{z}). \end{align*}若极大极小等式(\ref{equ:
minimax problem})成立,上式中全部取等号,故\begin{align*} \sup_{\boldsymbol{z} \in Z}
\phi(\boldsymbol{x}^*, \boldsymbol{z}) = \phi(\boldsymbol{x}^*,
\boldsymbol{z}^*) = \inf_{\boldsymbol{x} \in X} \phi(\boldsymbol{x},
\boldsymbol{z}^*), \end{align*}即$(\boldsymbol{x}^*,
\boldsymbol{z}^*)$为$\phi$的鞍点。

  另一方面,若$(\boldsymbol{x}^*,
\boldsymbol{z}^*)$为$\phi$的鞍点,则\begin{align*} \sup_{\boldsymbol{z} \in Z}
\phi(\boldsymbol{x}^*, \boldsymbol{z}) = \phi(\boldsymbol{x}^*,
\boldsymbol{z}^*) = \inf_{\boldsymbol{x} \in X} \phi(\boldsymbol{x},
\boldsymbol{z}^*), \end{align*}显然\begin{align*} \inf_{\boldsymbol{x} \in
X} \sup_{\boldsymbol{z} \in Z} \phi(\boldsymbol{x}, \boldsymbol{z}) \leq
\sup_{\boldsymbol{z} \in Z} \phi(\boldsymbol{x}^*, \boldsymbol{z}) =
\phi(\boldsymbol{x}^*, \boldsymbol{z}^*) = \inf_{\boldsymbol{x} \in X}
\phi(\boldsymbol{x}, \boldsymbol{z}^*) \leq \sup_{\boldsymbol{z} \in Z}
\inf_{\boldsymbol{x} \in X} \phi(\boldsymbol{x}, \boldsymbol{z}),
\end{align*}故极大极小等式(\ref{equ: minimax
problem})成立且上式中全部取等号,这意味着$\boldsymbol{x}^*$和$\boldsymbol{z}^*$分别是(\ref{equ:
saddle point a})和(\ref{equ: saddle point b})的最优解。

  若极大极小等式成立,则鞍点集合是$X^*$和$Z^*$的Cartesian积,其中$X^*$和$Z^*$分别是(\ref{equ:
saddle point a})和(\ref{equ: saddle point
b})的最优解的最优解集合,于是任取$\boldsymbol{x}^* \in X^*$及$\boldsymbol{z}^* \in
Z^*$可以得到一个鞍点$(\boldsymbol{x}^*, \boldsymbol{z}^*)$。
若极大极小等式不成立,则没有鞍点,参考如下这个例子。

  例3.4.2:设\begin{align*}
\phi(\boldsymbol{x}, \boldsymbol{z}) = \frac{1}{2} \boldsymbol{x}^\top
\boldsymbol{Q} \boldsymbol{x} + \boldsymbol{x}^\top \boldsymbol{z} -
\frac{1}{2} \boldsymbol{z}^\top \boldsymbol{R} \boldsymbol{z}, \ X = Z =
\mathbb{R}^n,
\end{align*}其中$\boldsymbol{Q}$和$\boldsymbol{R}$都是正定对称矩阵,易知有\begin{align*}
\sup_{\boldsymbol{z} \in \mathbb{R}^n} \phi(\boldsymbol{x},
\boldsymbol{z}) = \frac{1}{2} \boldsymbol{x}^\top (\boldsymbol{Q} +
\boldsymbol{R}^{-1}) \boldsymbol{x}, \ \inf_{\boldsymbol{x} \in
\mathbb{R}^n} \phi(\boldsymbol{x}, \boldsymbol{z}) = - \frac{1}{2}
\boldsymbol{z}^\top (\boldsymbol{Q}^{-1} + \boldsymbol{R})
\boldsymbol{z}.\end{align*}因此\begin{align*} \inf_{\boldsymbol{x} \in X}
\sup_{\boldsymbol{z} \in Z} \phi(\boldsymbol{x}, \boldsymbol{z}) = 0 =
\sup_{\boldsymbol{z} \in Z} \inf_{\boldsymbol{x} \in X}
\phi(\boldsymbol{x}, \boldsymbol{z}), \end{align*}此时有$X^* = Z^* = \{
\boldsymbol{0} \}$,即$( \boldsymbol{0} , \boldsymbol{0}
)$是唯一的鞍点。

  若$\boldsymbol{Q}$不是半正定矩阵,$\boldsymbol{R}$是正定矩阵且$\boldsymbol{Q}
+ \boldsymbol{R}^{-1}$是正定矩阵,那么\begin{align*}\sup_{\boldsymbol{z} \in
\mathbb{R}^n} \phi(\boldsymbol{x}, \boldsymbol{z}) = \frac{1}{2}
\boldsymbol{x}^\top (\boldsymbol{Q} + \boldsymbol{R}^{-1}) \boldsymbol{x},
\ \inf_{\boldsymbol{x} \in \mathbb{R}^n} \phi(\boldsymbol{x},
\boldsymbol{z}) = - \infty, \forall\boldsymbol{z} \in \mathbb{R}^n.
\end{align*}此时有$X^* = \{ \boldsymbol{0} \}$,$Z^* =
\mathbb{R}^n$,但是\begin{align*} 0 = \inf_{\boldsymbol{x} \in X}
\sup_{\boldsymbol{z} \in Z} \phi(\boldsymbol{x}, \boldsymbol{z}) >
\sup_{\boldsymbol{z} \in Z} \inf_{\boldsymbol{x} \in X}
\phi(\boldsymbol{x}, \boldsymbol{z}) = - \infty,
\end{align*}极大极小等式不成立,故没有鞍点。

时间: 2024-08-01 19:03:44

鞍点和极大极小理论的相关文章

约束优化

这一章我们介绍凸优化的基本概念和极大极小理论,并探讨最优解的存在性问题. 考虑如下形式的优化问题\begin{align*} \min_{\boldsymbol{x}} & \ f(\boldsymbol{x}) \\ \mbox{s.t.} & \ \boldsymbol{x} \in X. \end{align*}其中函数$f: \mathbb{R}^n \mapsto (-\infty, \infty]$,$X$是$\mathbb{R}^n$的非空子集.若向量$\boldsymbol

数值优化:计算基本理论

1. 优化问题 最一般的优化问题的表述是这样的: 求解等式约束 $\boldsymbol{g}(\boldsymbol{x})=0$ 和不等式约束 $\boldsymbol{h}(\boldsymbol{x})\leq 0$ 下使得取得 $\min f(\boldsymbol{x})$ 的解 $\boldsymbol{x}$ 其中 $f:\mathbb{R}^n\Rightarrow \mathbb{R}$,$\boldsymbol{g}:\mathbb{R}^n\Rightarrow \mat

机器学习—逻辑回归理论简介

下面是转载的内容,主要是介绍逻辑回归的理论知识,先总结一下自己看完的心得 简单来说线性回归就是直接将特征值和其对应的概率进行相乘得到一个结果,逻辑回归则是这样的结果上加上一个逻辑函数 这里选用的就是Sigmoid函数,在坐标尺度很大的情况下类似于阶跃函数 在确认特征对应的权重值也就是回归系数的时候 最常用的方法是最大似然法,EM参数估计,这个是在一阶导数能够有解的前提下 如果一阶导数无法求得解析值,那么一般选取梯度上升法,通过有限次的迭代过程,结合代价函数更新回归系数至收敛 //////////

关于ntp时间同步理论及配置参数-20170804

[原创]关于ntp时间同步理论及配置参数20170804 前言 NTP(Network Time Protocol,网络时间协议)是用来使网络中的各个计算机时间同步的一种协议.无论是平时使用的私人计算机还是在工作中搭建的服务器集群,时间的统一性和准确性是十分重要的.它是用来同步网络中各个计算机的时间的协议. 在计算机的世界里,时间非常地重要,例如对于火箭发射这种科研活动,对时间的统一性和准确性要求就非常地高,是按照A这台计算机的时间,还是按照B这台计算机的时间?NTP就是用来解决这个问题的,NT

Atitit.html css  浏览器原理理论概论导论attilax总结

Atitit.html css  浏览器原理理论概论导论attilax总结 1.1. 浏览器是怎样工作的:渲染引擎,HTML解析(连载二)1 2. 5.1.1 DOM标准 1011 3. <WebKit技术内幕>(朱永盛...)[简介_书评_在线阅读] - .html2 4. HTML5与CSS3权威指南(第3版 上册)2 5. HTML5权威指南[非常全面详实的网页设计参考书]3 6. 深入理解Android:WebKit卷4 1.1. 浏览器是怎样工作的:渲染引擎,HTML解析(连载二)

计算理论中的莱斯定理(Rice&#39;s Theorem)——证明与应用

我们给出一个在探讨不可判定性时非常有用的结论--莱斯定理(Rice's Theorem).首先,我们来看前面讨论过的几个不可判定的例子: 这些都是由图灵机识别之语言的性质.而莱斯定理告诉我们,任何由图灵机识别之语言的非平凡性质(nontrivial property)都是不可判定的. 最后通过几个例子来探讨一下莱斯定理的应用.来看看下面这个语言能否使用莱斯定理来确定其可判定性. {<M> | M是一个TM,且L(M)可由一些拥有偶数个状态的图灵机识别} 首先来确定这是否是一个语言属性,显然是的

Javascript设计模式理论与实战:适配器模式

有的时候在开发过程中,我们会发现,客户端需要的接口和提供的接口发生不兼容的问题.由于特殊的原因我们无法修改客户端接口.在这种情况下,我们需要适配现有接口和不兼容的类,这就要提到适配器模式.通过适配器,我们可以在不用修改旧代码的情况下也能使用它们,这就是适配器的能力. 基本理论 适配器模式:将一个接口转换成客户端需要的接口而不需要去修改客户端代码,使得不兼容的代码可以一起工作. 适配器主要有3个角色组成:(1)客户端:调用接口的类(2)适配器:用来连接客户端接口和提供服务的接口的类(3)适配者:提

TRIZ理论的进化法则分析(TRIZ学习笔记)

人们在创新和完善系统的过程可以遵循一定的规律(或者叫法则),从而减少创新和完善系统过程中的试错成本,下面就TRIZ的八大进化原则来进行说明(这个八大法则是前人们的总结,我这里当然会加入我的理解). 我们首先来看看一个技术系统(这里的定义是:为实现某种功能(或者职能)而存在的相互联系和作用的元件与运作事物集合)的构成,技术系统当然是分层次的,元件越少,能耗越小当然越好,一个理想的系统就是没有元件和成本,但功能却能实现,这种理想的系统虽然不存在,但却给我们提供了一个技术系统(产品)的改进方向,这就是

我的“第一次”,就这样没了:DDD(领域驱动设计)理论结合实践

写在前面 插一句:本人超爱落网-<平凡的世界>这一期,分享给大家. 阅读目录: 关于DDD 前期分析 框架搭建 代码实现 开源-发布 后记 第一次听你,清风吹送,田野短笛:第一次看你,半弯新湖,鱼跃翠堤:第一次念你,燕飞巢冷,释怀记忆:第一次梦你,云翔海岛,轮渡迤逦:第一次认你,怨江别续,草桥知己:第一次怕你,命悬一线,遗憾禁忌:第一次悟你,千年菩提,生死一起. 人生有很多的第一次:小时候第一次牙牙学语.第一次学蹒跚学步...长大后第一次上课.第一次逃课.第一次骑自行车.第一次懂事.第一次和喜