一、点球博弈
图中,l和r分别表示守门员的选择,向左(left)和向右(right),同理,L、M和R分别代表罚球运动员能够选择的策略,左/中/右。
数字表示能够罚进的概率,负表示罚失败的概率。
为了最大化进球,即 Max Eu1(si,s-i)

作出上一节我们讲到的求最佳策略(Best Response)图像

横坐标P(r)表示守门员扑向右侧的概率从0~100%的连续变化,纵坐标表示Eui(si,s-i)
奇怪的是:当我们引入这个图像时,原本并不存在劣势策略的选择中路,变成了劣势策略——因为随着P(r)的变化,选择收益最大要么是向右,要么向左(分界是P(r)=1|2)
所以这个模型的优势策略便是,当你认为守门远向右扑的概率低于50%时,向右踢;当你认为守门员向右扑的概率高于50%,向左踢(为什么我感觉这个结论很废话.....)

探讨这个模型的不足:
(1) 这个模型没有考虑守门员居中不动的状况,那么加入后会有什么变化呢?(想知道吗?不好意思,课后作业...)
(2)没有考虑左右脚球球员,他们踢向左向右时命中率不一样
(3)没有考虑球速与精度,比如某些球员喜欢大力出奇迹,往往会选择中路,因为他们精度不怎么样。但这与我们的Best Response相反,我们认为中路是始终的劣势。但是加入精度和球速的考虑后,因为中路的进球效率始终恒定(在图中是6),但是对于那些精度不怎么样的球员,也许他们踢中路的命中率远高于踢边路,事实上会让他们提高自己的命中率,比如提高到8。
如果我们在原图中插入一条为8的线段,Best Resonse 就会发生很重要的变化

二、合伙人博弈(Partnership Game):
给定假设:
(1). 你们均分利润
(2). 你们的收益由你们投入的精力决定,这里精力即为投入的时间t ,我们用0~4来标记你们选用的时间,即Si∈[0,4]
(3)你们的利润的表达公式为: 4 [ s1+s2+bs1s2 ] ,其中,0≤ b ≤ 1/4

所以,我们能够得出两者的收益(Payoffs)分别为:
u1(s1,s2) = 1/2 [ 4 ( s1+s2+bs1s2 ) ] - s1 s1
u2(s2,s1) = 1/2 [ 4 ( s2+s1+bs2s1 ) ] - s2 s2


我们怎样算出收益人的Best Reponse呢?
对他们的收益求s1的导数,(这里用到的是微积分的知识,微积分!天知道他说这个时候我说多么一脸蒙蔽,早忘了....)
u1(s1,s2) = 1/2 [ 4 ( s1+s2+bs1s2 ) ] - s1 s1
对它进行求导可得:
一级导数 foc : 2(1+ b s2)-2s1
二级导数 soc: -2
求二级导数,是为了确认:最大值处的2级导数是负数。(好像有点印象....柯西、拉客朗日神马的....)
则,另 2(1+ b s2)-2s1 = 0 使得 u1(s1,s2) 达到最大,、
有 Best Reponse
s1' = BR1(s2)= 1 + bs2

同理,可得
s2' = BR2(s1)= 1 + bs1


再然后,因为0≤ b ≤ 1/4,我们给出 b = 1/4 时两者的图像:



关于这个相交的点,我们称为纳什均衡( Nash equilibrium )

注1:
最近又看到笔记,看到这个博弈,我很不理解为什么b的取值范围是(0,1/4)
很明显,由 s1' = 1 + bs2 和 s2' = 1 + bs1
可以得到,b = 1 - 1/s1
对于 Si 的取值范围是(0 ~ 4)
那么相应的 b 的取值应该是(0,3/4)
为什么限定 b = 1/4 呢?是先天给定的条件吗?
因为是镜像的收益,所以均衡点是关于45度线对称的,可以算出当 b 取 (0,1/4)时它的均衡是在图中点(1,1)到(4/3,4/3)的线段,可以预估,如果 b 可以取到大于1/4时,它应该还有向上的部分。为什么没有这一段呢?
















博弈论Game Theory(2007)

主演:Christine Ajisafe David Mills Boynton Lian Chang Chike Chukwuma Abe Danz 

导演:Meredith Finkelstein / Paul Vlachos / 编剧:Meredith Finkelstein/Paul Vlachos