博弈论学习笔记(四)足球比赛与商业合作之最佳对策

点球案例

在一次足球比赛罚点球时,罚球队员可以选择L,M,R三种不同射门路径;门将可以选择扑向左路或者右路(原则上讲他也可以守在右路)。

  l r
L 4,-4 9,-9
M 6,-6 6,-6
R 9,-9 4,-4
该表表示各自的收益,其中,Lr对应的9表示当射手射向左路而门将扑向右路时,射手有90%的概率进球,-9表示门将有90%的概率丢球(10%概率射偏)。其他收益以此类推。
我们假设门将扑向右路的概率是Pr,那么门将扑向左路的概率是Pl=1-Pr。
那么,射手
	选择左路的预期收益为 EU1(L,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*4 + Pr*9 = 4 + 5*Pr;
	选择中路的预期收益为 EU1(M,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*6 + Pr*6 = 6;
	选择右路的预期收益为 EU1(R,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*9 + Pr*4 = 9 - 5*Pr;

结论:从中路射门都不是一个最佳策略;不要选择在任何信念下都不是最佳策略的策略。

定义:参与者i的对策si是对手的策略s-i的最佳对策,当且仅当对于参与者i的所有其他策略si‘,U1(si,s-i)>=U1(si‘,s-i)

商业合作案例

两个参与者都是公司的股东,他们都持有公司的股份并且平分利润。
si表示第i个股东为公司付出的精力。i=1,2。
总收益为4*(s1 + s2 + B*s1*s2)
所以对于每个参与者,他们能够获得的收益是1/2*4*(s1 + s2 + B*s1*s2) = 2*(s1 + s2 + B*s1*s2)
我们现在来考虑参与者1,他的付出是s1^2,s所以他的净收益为:2*(s1 + s2 + B*s1*s2) - s1^2
为了让收益最大,对s1求导得出收益导数为0的方程:s1 = 1 + B*s2
同理,对于s2,s2 = 1 + B*s1
我们这里设B=1/4。S=[1,4]。

这里看一看到,因为s1的范围只在1和2之间,所以[0,1]和[3,4]是s1的劣势策略;
同理,[0,1]和[3,4]是s2的劣势策略。
所以剔除之后剩下了s1∈[1,2],s2∈[1,2]这个区间,我们将其放大四倍,发现了和原来一样的图。
然后我们就可以接待进行剔除了。
最后得到的点就是方程组:
	s1 = 1 + B*s2
	s2 = 1 + B*s1
的解。
得出:
	s1 = s2 = 1/(B-1)
(1/(B-1), 1/(B-1))这个点称为纳什均衡 Nash Equilibrium

这意味着博弈双方彼此都不想偏离纳什均衡点。在纳什均衡点处,双方都采取彼此的最佳对策。

时间: 2024-10-19 13:55:53

博弈论学习笔记(四)足球比赛与商业合作之最佳对策的相关文章

Caliburn.Micro学习笔记(四)----IHandle<T>实现多语言功能

Caliburn.Micro学习笔记(四)----IHandle<T>实现多语言功能 说一下IHandle<T>实现多语言功能 因为Caliburn.Micro是基于MvvM的UI与codebehind分离, binding可以是双向的所以我们想动态的实现多语言切换很是方便今天我做一个小demo给大家提供一个思路 先看一下效果 点击英文  变成英文状态点chinese就会变成中文                          源码的下载地址在文章的最下边 多语言用的是资源文件建

代码管理工具 --- git的学习笔记四《重新整理git(1)》

1.创建版本库 mkdir  创建目录 cd  地址,到该地址下 pwd 显示当前目录 1.创建目录 $ mkdir startGit $ cd startGit $ pwd 显示当前目录 或者cd到桌面,然后再创建目录 2.初始化版本库 $ git init 初始化仓库 提示信息:Initialized empty Git repository in /Users/xingzai/Desktop/startGit/.git/ 建立一个空的git仓库在/Users/xingzai/Desktop

Linux学习笔记四:Linux的文件搜索命令

1.文件搜索命令  which 语法:which [命令名称] 范例:$which ls  列出ls命令所在目录 [[email protected] ~]$ which ls alias ls='ls --color=auto' /bin/ls 另外一个命令:whereis [名称名称],也可以列出命令所在目录. [[email protected] ~]$ whereis ls ls: /bin/ls /usr/share/man/man1/ls.1.gz /usr/share/man/ma

小猪的数据结构学习笔记(四)

小猪的数据结构学习笔记(四) 线性表之静态链表 --转载请注明出处:coder-pig 本章引言: 在二,三中中我们分别学习了顺序表中的线性表与单链表,线性表有点类似于 我们前面所学的数组,而单链表使用的最多的是指针,这里问个简单的问题, 如果是在以前没有指针的话,前辈先人们怎么实现单链表呢?大家思考下! 没有指针,那么用什么来代替呢?前辈先人们非常机智,想出了使用下标+游标的方式 来实现单链表的效果!也就是今天要讲的--静态链表! 当然你也可以直接跳过本章,因为有了单链表就没有必要用静态链表了

Swift学习笔记四:数组和字典

最近一个月都在专心做unity3d的斗地主游戏,从早到晚,最后总算是搞出来了,其中的心酸只有自己知道.最近才有功夫闲下来,还是学习学习之前的老本行--asp.net,现在用.net做项目流行MVC,而不是之前的三层,既然技术在更新,只能不断学习,以适应新的技术潮流! 创建MVC工程 1.打开Visual studio2012,新建MVC4工程 2.选择工程属性,创建MVC工程 3.生成工程的目录 App_Start:启动文件的配置信息,包括很重要的RouteConfig路由注册信息 Conten

NLTK学习笔记(四):自然语言处理的一些算法研究

自然语言处理中算法设计有两大部分:分而治之 和 转化 思想.一个是将大问题简化为小问题,另一个是将问题抽象化,向向已知转化.前者的例子:归并排序:后者的例子:判断相邻元素是否相同(与排序). 这次总结的自然语言中常用的一些基本算法,算是入个门了. 递归 使用递归速度上会受影响,但是便于理解算法深层嵌套对象.而一些函数式编程语言会将尾递归优化为迭代. 如果要计算n个词有多少种组合方式?按照阶乘定义:n! = n*(n-1)*...*1 def func(wordlist): length = le

Android学习笔记四:添加Source

问题描述 Source not foundThe JAR file D:\.....\sdk\platforms\android-20\android.jar has no source attachment. 问题原因及解决办法 1. 使用SDK Manager下载最新版本的Sources for Android SDK 一般文件下载目录默认在SDK下的sources文件中即 \adt-bundle-windows-x86_64-20130522\sdk\sources\android-20

【Unity 3D】学习笔记四十二:粒子特效

粒子特效 粒子特效的原理是将若干粒子无规则的组合在一起,来模拟火焰,爆炸,水滴,雾气等效果.要使用粒子特效首先要创建,在hierarchy视图中点击create--particle system即可 粒子发射器 粒子发射器是用于设定粒子的发射属性,比如说粒子的大小,数量和速度等.在创建完粒子对象后,在右侧inspector视图中便可以看到所有的粒子属性: emit:是否是使用粒子发射器. min size:粒子最小尺寸. max size:粒子最大尺寸. min energy:粒子的最小生命周期

WEB前端学习笔记 四

接上一篇,web学习笔记 四,在此感谢您对此篇笔记的认可,但转发时请注明文章出自网知博学. 2.0  html的语法格式 html的标签要写在尖括号中 :<> 在在英文输入法状态下,按住shift键然后再按它左侧的尖括号就可了, 先学习一个简单的h1标签,是个标题标签,在html中这样写: <h1>我在h1标签中,我就是标题</h1> 那么h1标签中所包裹的文字,就标记成标题了.通过浏览器的解析后在页面上显示出来的效果就是字体加粗,加黑,和word中的标题性质一样! 大