博弈论初步
10.1?复习笔记
【知识框架】
【考点难点归纳】
考点一:几个基本概念(见表10-1)?★★★
表10-1?几个基本概念
考点二:完全信息静态博弈——纯策略均衡?★★★★
1条件策略和条件策略组合
条件策略是条件优势策略的简称,是指在同时博弈中,在给定其他参与人的策略时,某个参与人的最优策略。条件策略组合是条件优势策略组合的简称,是指包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合。
2纳什均衡
如表10-2所示,(不合作,不合作)既是甲厂商的条件策略组合,也是乙厂商的条件策略组合,在该策略组合上,甲厂商和乙厂商都没有单独改变策略的倾向。
表10-2?寡头博弈:合作与不合作
纳什均衡是指在对手选择既定的情况下,每一个参与人的选择都是最佳选择的一种策略组合。因此,在纳什均衡条件下,所有的参与人都不会去改变他们所选择的策略。
3寻找纳什均衡的方法——条件策略下划线法
对于一个简单的“二人同时博弈”,可以用一个以二元数组为元素的支付矩阵来表示,并用“条件策略下划线法”来确定它的纳什均衡。具体步骤如下:
(1)把整个博弈的支付矩阵分解为两个参与人的支付矩阵。
(2)在第一个(即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线。
(3)在第二个(即位于整个博弈矩阵上方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线。
(4)将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵。
(5)在带有下划线的整个博弈的支付矩阵中,找到两个数字之下均有下划线的支付组合。由该支付组合代表的策略组合就是博弈的纳什均衡。
4囚徒困境
囚徒困境的博弈模型的假设条件是:甲、乙两个被怀疑为合谋偷窃的嫌疑犯被警方抓获,但警方对他们偷窃的证据并不充分。他们每一个人都被单独囚禁,并单独进行审讯,即双方无法互通信息。警方向这两个嫌疑犯交代的量刑原则是:如果一方坦白,另一方不坦白,则坦白者自由;不坦白者从重处理,判刑20年。如果两人都坦白,则每人都各判刑8年。如果两个都不坦白,则警方由于证据不足,只能对每个人各判刑1年。表10-3的支付矩阵描述了这一博弈。表中的报酬均为负数,以表示判刑的年数。
表10-3?囚徒困境
通过分析可以看出,囚徒困境的博弈有唯一纳什均衡(坦白,坦白)。但是,如果两人都选择不坦白(即合作),则都可以获得最好的结局。因此,囚徒困境的纳什均衡反映了一个矛盾:即个人理性和团体理性的冲突。
考点三:完全信息静态博弈——混合策略均衡?★★★★
并不是所有的博弈都存在纯策略纳什均衡。比如,如表10-4所示,该博弈不存在纯策略纳什均衡,但存在混合策略纳什均衡。混合策略纳什均衡是指给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率的一种均衡状态。可以证明,混合策略均衡总是存在的。
表10-4?社会福利博弈
关于混合策略均衡的一些概念如表10-5所示。
表10-5?混合策略均衡的相关概念
考点四:完全信息动态博弈?★★★
在完全信息动态博弈中,参与人的决策有先后之分,尤其是,后行动的参与人可以观察到先行动的参与人所采取的策略。“博弈树”通常被作为用来描述完全信息动态博弈的工具。
在完全信息动态博弈中,可能存在多个纳什均衡的情况。在多个纳什均衡中,有些可能并不合理。对纳什均衡的“精炼”是指从众多的纳什均衡中进一步确定“更好”的纳什均衡。“逆向归纳法”常常被用于纳什均衡的精炼,具体包括以下两个步骤:
(1)从博弈的最后阶段的每一个决策点开始,确定相应参与人此时选择的策略,并把参与人放弃的其他策略删除,以得到原博弈的一个简化博弈。
(2)对简化博弈重复步骤一的程序,从而得到原博弈的一个最简博弈。这个最简博弈,就是原博弈的解;在存在多重纳什均衡时,它就是对纳什均衡的精炼。
本文暂时没有评论,来添加一个吧(●'◡'●)