读书笔记: 博弈论导论 - 14 - 不完整信息的静态博弈 机制设计

读书笔记: 博弈论导论 - 14 - 不完整信息的静态博弈 机制设计

机制设计(Mechanism Design)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

机制设计的概念

机制设计的目标是设计一个可以达到期望收益的博弈。
由于这是根据博弈结果来推导博弈的形式,也被称为反向博弈论(reverse game theory)。
这个理论明显在经济和政治方面有很多用途。
我们假象这样一个例子:

某个政府需要设计一个关于化工厂的环保政策。
这个政策可能涉及到:几个化工厂、政府和大众。
大概的想法是:政府有一些排放许可;化工厂需要从政府那里买排放许可;政府和大众利用获得的资金改善环境。
机制设计的核心是:制定玩家的行动和支付资金的关系。

从上面的例子可以看出一些新的元素:

  • 排放许可
    在理论中称之为替代选择(alternatives),或者叫做公共物品(public good)。
  • 资金的转移(monetary transfer)

新的概念:

  • 机制设计者(mechanism designer)
    也称为中央集权(central authority)。中央集权不一定是玩家。
  • 替代选择(alternatives)或者公共物品(public good)
    中央集权提供的公共物品或者服务。
    将成为玩家的结果(outcome)的一部分。
  • 资金的转移(monetary transfer)
    每个玩家获得的资金。负数表示支付的资金,
    成为收益函数的一部分。
  • 收益函数
    在机制设计中,玩家的结果包含两部分:公共物品和资金的转移。
    另外,我们简单地加上资金部分作为收益。
    所以收益函数变为:
    \[
    v_i(x, m_i, \theta_i) = u(x, \theta_i) + m_i
    \]
  • 所有玩家的一个结果组合(outcomes)
    这里用y来表示,以区分x。
    \[
    y = (x, m_1, \cdots, m_n) : x \in X, m_i \in \mathbb{R} \ \forall i \in N, \sum_{i=1}^{n} m_i \leq 0 \y_i = (x_i, m_i)
    \]
  • 选择规则(choice rule)
    根据类型\(\theta\)得到机制的结果\(y\)。
    \[
    f(\theta) = (x(\theta), m_1(\theta), \cdots, m_n(\theta)) \where \x(\theta) \text( : decision rule) \(m_1(\theta), \cdots, m_n(\theta)) \text( : transfer rule)
    \]
    选择条件定义了每个类型想要的结果。

机制设计者面临的问题和一个方向

机制设计者面临的问题和一个方向

在不完整信息博弈中,私有信息(机制设计者不知道的信息):

  • 每个玩家的类型\(\theta\)。
    公共知识:
  • 类型集合\(\Theta\)
  • 每种类型的选择规则,也就是每种类型玩家倾向的结果
  • 每种类型的策略,就是每种类型玩家的倾向策略
  • 策略行动导致的结果。

机制设计的两个方向之一,是在不知道玩家的类型(这是私有信息)的情况下,
设计出一个足够聪明的博弈,能够保证:

  • 对于每种类型的玩家组合,其选择规则的结果,和博弈的贝叶斯纳什均衡的结果一致。
    也就是说,其选择规则结果和博弈的策略引起的结果一致。
    满足上面条件的机制,则称之实现了选择规则。
    下面是相应的数学说明。
  • 机制(mechanism)
    机制规定了玩家的行动集合,以及行动结果与资金转移的关系。
    \[
    \Gamma = \langle A_1, \cdots, A_n, g(\cdot) \rangle \where \g : A_1 \times \cdots A_n \to Y \\]
  • 玩家i的纯策略
    \(s_i : \Theta_i \to A_i\)
  • 玩家i的收益函数
    \(v_i(g(s), \theta_i)\)
  • 贝叶斯纳什均衡(Bayesian Nash Equilibrium)
    如果满足下面条件,一个策略组合\(s^*(\cdot) = (s_1^*(\cdot), \cdots, s_n^*(\cdot))\)
    是一个机制\(\Gamma = \langle A_1, \cdots, A_n, g(\cdot) \rangle\)的贝叶斯纳什均衡:
    \[
    E_{\theta_{-1}} [v_i(g(s_i^*(\theta_i), s_{-i}^*(\theta_{-i})), \theta_i) | \theta_i] \geq E_{\theta_{-1}} [v_i(g(a_i, s_{-i}^*(\theta_{-i})), \theta_i) | \theta_i], \forall a_i \in A_i, \forall i \in N, \forall \theta_i \in \Theta_i
    \]

    也就是说,对于每种类型组合,每个玩家,当对手的策略是这个策略组合时,这个玩家的这个策略组合的策略是最优的(其期望收益大于等于其它的所有策略的期望收益)。

  • 机制实现选择规则
    如果满足下面条件,则这个机制\(\Gamma\)实现了(implement)选择规则\(f(\cdot)\):
    存在一个贝叶斯纳什均衡\(s^*(s_1^*(\theta_1), \cdots, s_n^*(\theta_n))\),满足:
    \[
    g(s_1^*(\theta_1), \cdots, s_n^*(\theta_n)) = f(\theta), \forall \theta_i \in \Theta_i
    \]
  • 部分实现(partial implementation)和完全实现(full implementation)
    除了期望的贝叶斯纳什均衡,如果允许存在其它的、不期望的均衡,成为部分实现;
    如果不允许存在其它的、不期望的均衡,成为完全实现;

揭露原理(the revelation principle)

机制设计的另外一个方向:玩家意识到机制设计者会实现他的选择条件\(f(\cdot)\)时,玩家会透露自己的类型。

  • 直接揭露机制(direct revelation mechanism)
    一个选择规则\(f(\cdot)\)的直接揭露机制\(\Gamma = \langle \Theta_1, \cdots, \Theta_n, f(\cdot) \rangle\)是:
    \[
    A_i = \Theta_i, \forall i \in N \g(\theta) = f(\theta), \forall \theta \in \Theta
    \]
    解释:

    对于每个玩家,其行动集合\(\Theta\)是选择规则\(\Theta_i\)对应的行动集合(想象一下,每个类型对应一个策略,一个策略对应一个行动)。
    对于每个类型\(\theta\),它的选择规则(想要的)结果\(f(\theta)\)和机制设计的结果\(g(\theta)\)一致。

  • 在贝叶斯纳什均衡中诚实地可实现的(truthfully implementable in Bayesian Nash equilibrium)
    一个选择规则\(f(\cdot)\)是在贝叶斯纳什均衡中诚实地可实现的,
    如果这个选择规则的直接揭露机制\(\Gamma = \langle \Theta_1, \cdots, \Theta_n, f(\cdot) \rangle\)有一个贝叶斯纳什均衡\(s_i^*(\theta_i) = \theta_i\),
    也就是说,满足:
    \[
    E_{\theta_{-1}} [v_i(f(\theta_i, \theta_{-i}), \theta_i) | \theta_i] \geq E_{\theta_{-1}} [v_i(g(\theta_i', \theta_{-i}), \theta_i) | \theta_i], \forall \theta_i' \in \Theta_i
    \]
    解释:

    当解释规则的直接揭露机制有有一个贝叶斯纳什均衡解,则其实完全可满足的。

推论 14.1 : 对于贝叶斯纳什实现的揭露原理
一个选择规则\(f(\cdot)\)在贝叶斯纳什均衡中是可实现的,当且仅当它在贝叶斯纳什均衡中诚实地可实现的(truthfully implementable in Bayesian Nash equilibrium)。

揭露原理的想法:

在均衡中,玩家知道这个机制实现了选择规则\(f(\cdot)\),所以会何其保持一致。
因此他们可能会诚实地述说他们的类型,让机制设计者直接实现选择规则\(f(\cdot)\)。

优势策略和Vickrey-Clarke-Groves机制

  • 优势策略
    如果满足以下条件,则策略组合\(s^*(\cdot) = (s_1^*(\cdot), \cdots, s_n^*(\cdot))\)是一个机制\(\Gamma = \langle A_1, \cdots, A_n, g(\cdot) \rangle\)的优势策略:
    \[
    v_i(g(s_i^*(\theta), a_{-i}), \theta_i) \geq v_i(g(a_i', a_{-i}), \theta_i), \forall a_i \in A_i, \forall a_{-i} \in A_{-i}, \forall i \in N, \forall \theta_i \in \Theta_i
    \]
    同时,揭露原理意味着如果选择法则\(f(\cdot)\)如果一个选择规则可以被一个优势策略实现,我们只要检测这个选择法则是在优势策略中诚实地可实现的。
    即:
    \[
    v_i(f(\theta_i, \theta_{-i}), \theta_i) \geq v_i(f(\theta_i', \theta_{-i}), \theta_i), \forall \theta_i \in \Theta_i, \forall \theta_{-i} \in \Theta_{-i}, \forall i \in N, \forall \theta_i \in \Theta_i
    \]

推论 14.2
在一个准线性(quasilinear)环境中,给定一个实例状态\(\theta \in \Theta\),
一个替代物(alternative)\(x^* \in X\)是一个帕累托优化,当且仅当下面有一个解:
\[
\max_{x \in X} \sum_{i=1}^I u_i(x_i, \theta_i)
\]

  • First-best decision rule
    如果对于\(\forall \ \theta \in \Theta\), \(x^*(\theta)\)都是帕累托优化的,则\(x^*(\cdot)\)为First-best decision rule。
  • Vickrey-Clarke-Groves机制
    给定一个宣布的类型\(\theta'\),
    这个选择规则\(f(\theta') = (x(\theta'), m_1(\theta'), \cdots, m_n(\theta') )\)是一个Vickrey-Clarke-Groves机制,
    如果\(x^*(\cdot)\)是一个第一好决定规则(first-best decision rule),并且:
    \[
    m_i(\theta') = \sum_{j \neq i} u_j(x^*(\theta'_j, \theta'_{-i}), \theta'_j) + h_i(\theta'_{-i}) \where \h_i(\theta'_{-i}) \text{ is an arbitrary function of } \theta'_{-i}
    \]

解释:

没有完全看懂。大概的意思是对于First-best decision rule \(x^*(\cdot)\),
可以找到一个转移规则\((m_1(\cdot), \cdots, m_n(\cdot))\),
让选择规则成为一个在优势策略中可实现。

下面是一个解:

  • Pivotal Mechanism - a particular form of Vickrey-Clarke-Groves机制
    \[
    h_i(\theta'_{-i}) = - \sum_{j \neq i} u_j(x_{-i}^*(\theta'_{-i}), \theta'_j) \where \x_{-i}^*(\theta'_{-i}) \in \arg \max_{x \in X} \sum_{j \neq i} u_j(x, \theta'_j) \Thus \m_i(\theta') = \sum_{j \neq i} u_j(x^*(\theta'_j, \theta'_{-i}), \theta'_j) - \sum_{j \neq i} u_j(x_{-i}^*(\theta'_{-i}), \theta'_j) \\]

参照

原文地址:https://www.cnblogs.com/steven-yang/p/8372174.html

时间: 2024-10-10 15:01:10

读书笔记: 博弈论导论 - 14 - 不完整信息的静态博弈 机制设计的相关文章

读书笔记: 博弈论导论 - 12 - 不完整信息的静态博弈 贝叶斯博弈

读书笔记: 博弈论导论 - 12 - 不完整信息的静态博弈 贝叶斯博弈 贝叶斯博弈(Bayesian Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记. 不完整信息的静态博弈(Incomplete information static games) 不完整信息博弈意味着玩家之间缺乏共识(common knowledge),具体指的是其它对手的行动集.结果集和收益函数等信息. 对不完整信息博弈的处理方法来自于Harsan

读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈 建立信誉

读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈 建立信誉 建立信誉(Building a Reputation) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记. 为什么我们要建立良好的信誉?为什么我们更愿意和有信誉的人交往? 本章从囚徒困境这个问题,证明了即使在2阶段的囚徒困境中,如果一方有可能选择合作(也就是沉默),另一个方在第一阶段也有可能选择合作. 让我们回忆一下囚徒困境. 囚徒困境的均衡是双方都告密. 在有限

读书笔记: 博弈论导论 - 06 - 混合的策略

读书笔记: 博弈论导论 - 06 - 混合的策略 混合的策略 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记. 策略,信念和期望收益 混合策略 玩家i的有限纯策略集合\(S_i = {s_{i1}, s_{i2}, \cdots, s_{im}}\). 将\(\Delta S_i\)定义为\(S_i\)的单纯形,是在\(S_i\)上所有概率分布的集合. 玩家i的一个混合策略(mixed strategy)是\(\sigma_i \

读书笔记 -- 算法导论(第二部分 排序和顺序统计学)

输入数据的结构 在实际中,待排序的数很少是孤立的值,它们通常是一个称为记录的数据集的一部分.每个记录有一个关键字key,它是待排序的值.记录的其他数据称为卫星数据,即它们通常以key为中心传送.在一个排序的算法中,当交换关键字时,卫星数据也必须交换.如果记录都很大,我们可以交换一组指向各个记录的指针而不是记录本身,以求将数据移动量减少到最小. 在一定意义上,正式这些实现细节才使得一个完整的程序不同于算法.不管我们要排序的是单个的数值还是包含数据的大型记录,就排序的方法来说它们都是一样的.因为,为

《javascript设计模式》读书笔记二(封装和隐藏信息)

1.为什么要封装和信息隐藏 做过编程的朋友们知道"耦合"这个词,其实封装的效果就是为了解耦,让类和类之间没有太多的联系,防止某一天修改某一类的时候,产生"多米骨诺牌效应". 我们可以把信息隐藏看成目的,把封装看成达到信息隐藏的技术.通过封装就可以把对象的内部数据表现形式和实现细节进行隐藏.就好比你会看电视,但是你不知道电视的内部结构一样.但是在javascript中没有任何内置的机制,所以我们还需做些处理,同样来模仿封装. 2.创建对象的方法 1)最简单的一种方法就

《UNIX环境高级编程》读书笔记之系统数据文件和信息(1)

1.UNIX系统口令文件包括了下图所看到的的各字段,这些字段包括在<pwd.h>中定义的passwd结构体中 POSIX定义了两个获取口令文件项的函数. 在给出用户登录名或用户ID后.这两个函数就能查看相关项. #include <pwd.h> struct passwd *getpwuid(uid_t uid); struct passwd *getpwnam(const char *name); 假设想要查看整个口令文件,则要用到以下三个函数: #include <pwd

【计算机网络(谢希仁)-读书笔记】1.1计算机网络在信息时代中的作用

21世纪是以网络(电信网络,有线电视网络,计算机网络)为核心的信息时代 电信网络:向用户提供电话,电报及传真等服务 有线电视网络:向用户提供各种电视节目 计算机网络(三网核心):使用户能够迅速传送数据文件,以及从网络上查找并获取各种有用资料,包括图像和视频. Internet是仅次于全球电话网的世界第二大网络(是人类自印刷技术发明以来在通信方面最大的变革). 计算机网络是一种通信基础设施,端设备是功能强大且有智能的计算机. 计算机网络向用户提供的最重要的两个功能:连通性和(资源)共享

读书笔记 -- 算法导论 (序言+第一部分)

什么是基础呢? 就是要把我们大学所学的离散数学,算法与数据结构,操作系统,计算机体系结构,编译原理等课程学好.对计算机的体系,CPU本身,操作系统内核,系统平台,面向对象编程,程序的性能等要有深层次的掌握.要编写出优秀的代码同样要扎实的基础,如果数据结构和算法学的不好,怎么对程序的性能进行优化,怎样从类库中选择合适的数据结构.如果不了解操作系统,怎样能了解这些开发工具的原理,它们都是基于操作系统的.不了解汇编,编译原理,怎么知道程序运行时要多长时间要多少内存,就不能编出高效的代码.把面向对象,软

读书笔记2014第14本:《李鸿章传》

最近翻看了梁启超写的<李鸿章传>,本来这本书是孩子暑假时老师推荐的一本读物,她看完后写了一段读后感交了作业,正好我也想读本历史传记类的书轻松一下,就快速浏览了一遍. 这本书难怪语文老师推荐孩子们阅读,全书前半部是译文,后半部是文言文的原文,应该是看原文对孩子的语文水平有帮助,当然我就略过文言文不读了,遇到精彩的句子才去看看原文是如何写的.原文还是要翻一下的,至少插图是不一样的. 全书以“天下惟庸人无咎无誉”开篇,翻译为白话文就不朗朗上口了,“天下只有平庸之人既不会挨骂,也不会得到赞誉”.从以前