博弈论与生活中的经济学 .ppt
4.1 最优应对与纳什均衡-- 4.1.2纳什均衡 也就是说,当达到纳什均衡时,每个参与者都选择了自身最佳策略,因此,我们可以通过检验一个策略集合里各项策略是否互为最佳应对,来确定该策略集合是否构成纳什均衡。图4-2里,我们用粗线标明了丈夫和妻子针对对方各种策略的最佳应对,很明显,只要某个格子里两人的收益数字都画了线,这就说明这对策略是彼此的最佳反应,这样的策略组合就是我们要找的纳什均衡我们很快就能从图4-2中看出,两种情形都符合纳什均衡的要求,第一种是男性不售卖手表而女性进行修剪头发,第二种是男性售卖手表而女性不修剪头发,这两种状态都是纳什均衡。4.1 最优对策与纳什均衡-- 4.1.2 纳什均衡 通过划线标示出各方针对不同策略的最佳应对,接着识别所有数值均带下划线的方格,此即为画线求解法的操作步骤,用以探寻纳什均衡状态,此方法适用于策略为离散形式的二人有限博弈情形。同学们或许有许多困惑,比如他们可能会想:你所说的(不卖,剪发)和(卖表,不剪)这两种情形是均势kaiyun全站网页版登录,是稳定状态;然而小说里实际呈现的结局却是(卖表,剪发)。这种情况为何会出现,我们在下一章的混合策略部分可以阐明原因。最优对策与纳什均衡--纳什均衡的更多策略情形,我们再借助一个实例来回顾一下如何运用划线技巧找出纳什均衡,从而加深理解,例如参照图4-3所示内容。图4-3 展示了通过画线方式寻找纳什均衡的过程 4.1 探讨最优反应与纳什均衡-- 4.1.2 纳什均衡分析 35 44 51 61 28 110 37 58 44 李四 选择 上 下 选择 上 中 张三 选择 中 下 4.1 最优反应与纳什均衡-- 4.1.2 纳什均衡分析 图4-3 的结构看起来比之前的示例更为复杂,因为先前的案例中参与者仅有两种可选方案,而当前情境下每位参与者拥有三种可能选择,不过采用画线技巧确定纳什均衡的复杂程度并未提升针对张三的每种方案,我们需确定李四能获得最高收益的应对方法,这通常在张三方案对应的行中寻找,随后在最大收益处划线;接下来,我们再针对李四的每种方案,找出张三能获得最大收益的应对策略,这通常在李四方案对应的列中寻找,同样在最大收益处划线。最终,我们识别出那些张三和李四的收益处带有标记的对应策略搭配,这些搭配即为纳什均衡,4.1 最优反应与纳什均衡-- 4.1.2纳什均衡 运用划线技巧,针对任何借助收益矩阵描述的博弈,我们皆可借此方法探寻纳什均衡,因此此刻可以不受限制,研究我们关注的各种博弈,特别是后面要分析的几个典型静态博弈类型。4.2 电视频道性别冲突叙事模式,一对伴侣,男方偏爱足球赛事,女方倾心家庭剧,家中仅有一台电视机,由此引发频道归属之争。假如双方都愿意观赏足球比赛,那么男性可以收获两份满足感,女性可以获得一份满足感;倘若彼此都倾向于观看肥皂剧,男性能感受到一份满足感,女性则能收获两份满足感;若两人看法相左,最终只能选择无人观看,彼此的满足感都将归零。电视频道存在性别博弈现象,其策略性表达如图4-4所示,标题为性别战:电视频道争夺,具体数据为21, 00, 00, 12,涉及妻子和丈夫的选择,分别是足球赛与肥皂剧的组合,包括足球赛对足球赛,肥皂剧对肥皂剧等多种情况kaiyun官方网站登录入口,该博弈的纳什均衡可以通过划线方法找到,最终确定的均衡点是(足球赛,足球赛)以及(肥皂剧,肥皂剧)。这个游戏有个显著特点,要是对手非要己见,那就妥协比对抗更有利。当某人执意选自己偏爱的节目时,退让至少能带来1个效用值,而硬碰硬则什么都得不到。这种情况在生活里也很常见,比如夫妻俩中有个性子犟的,另一个往往就随和些,适当让步。性别战博弈的框架和麦琪的礼物类似,这种博弈模式有两个稳定状态,参与者双方各有偏好的稳定状态,例如男性倾向于选择观看足球赛的情况,女性则更青睐观看肥皂剧的局面;尽管双方各有偏好,但他们依然存在共同点,因为在任何一种稳定状态下,他们获得的满足感都强于非稳定状态。性别对立中,哪种平衡状态会形成呢?这或许要看夫妻在家里的角色分工,要是事事都由男方做决定,那么很可能会形成男方主导的格局;也可能存在互相交替掌权的情况。不过通常来说,在性别对立的较量里,塑造一个坚定有力的姿态可能更有利。性别角力在组织中的体现,具体表现为上下级之间的较量。身处层级结构中的人,都清楚上下级间的互动十分复杂。部分组织里,上级对下属态度严厉,有铁腕上司之称。另一些组织内,下属对上级不示弱,被称作鹰派员工。设想一位领导与其部下展开较量,针对某个存在分歧的事项,双方都有可能采取强硬立场或妥协立场,具体的收益状况见于图表四和图表五。4.2 电视频道性别冲突---例 独断领导与强势部下 图4-5 组织内部权谋活动 00 52 25 11 部下 坚强 顺从 坚强 顺从 领导 4.2 电视频道性别冲突---例 独断领导与强势部下 可以明显看出,这场博弈的纳什均衡是(坚强,顺从)以及(顺从,坚强),倘若领导强硬,部下就应当顺从,要是部下坚强,领导则最好是顺从的。这种情况在多数团体里很常见,当领导立场强硬时,部下只能勉强顺从,要是部下完全抵触,领导就不得不有所退让。这种互动模式能带给我们什么思考呢?在这种互动里,如果领导展现出强势风格,或许能从中得到益处。一个粗鲁的、不体恤下属的领导常常让员工更加害怕,员工因此不敢与其对抗,那么最终的平衡状态很可能是(强势,顺从)。相反,如果一个部下向来以强硬著称,那么领导通常也会对其有所顾忌,最终的平衡状态很可能是(顺从,强势)。铁腕上司很普遍,但鹰派下属却比较少见,这种看法其实不准确。组织里上司权力被架空的情况很常见,特别是在政治团体中。有些政治团体的领导者以严厉手段闻名,而另一些领导者则只是名义上的头目。四三 软弱者对决—叙事范例 在五十年代,美国一部广受欢迎的影片《无端叛逆》里,迪恩和同窗们进行了一场较量:将汽车驶向悬崖边,以谁最迟跳出车外为胜,条件是必须在他人的车辆坠崖之前完成动作,这种比拼胆量的游戏在香港电影中也常见到我们所探讨的怯懦行为较量,与前者略有差异,在于双方驾驶的车辆并非驶向峭壁,而是在一个存在碰撞风险的情境中,各自向前行驶。人们可以选择在碰撞发生前改变方向来避免危险,不过这种行为会被看作是胆怯的表现;或者他们决定保持直线行驶——当双方都向前时,可能会造成车辆损毁和人员伤亡;而如果一方转向另一方直行,那么坚持直行的驾驶员会被称作是勇敢的人。4.3 懦夫博弈—故事模型 我们将他们在不同情境中的所得转化为相应的效用数值,参见图4-6 11 -22 2-2 -4-4 司机乙 向前 转向 向前 转向 司机甲 4.3 懦夫博弈 懦夫博弈即便属于我们设计出来的范例,也与我们现实生活里的一些状况存在相似之处例如,当两辆车朝着彼此的方向行驶并在狭窄路段相遇时,双方都不肯让行的情况。从博弈的收益分析角度来看,双方应当采取一种合作姿态,哪怕只是部分合作,这种选择也可能是有益的。然而,通过运用划线法进行求解,我们马上就能看出,(改变方向,改变方向)并非纳什均衡的产物。纳什均衡的结果将是(继续直行,改变方向)以及(改变方向,继续直行)。也就是说,一种情况是一个司机向前行驶,另一种情况是另一个司机改变方向让行。懦夫博弈和性别战博弈在结构上存在显著差异,这种差异体现在哪里呢?4.3 懦夫博弈 性别战博弈里包含部分共同利益(尽管这些利益并非完全一致),而懦夫博弈则没有任何共同利益(个人的愉悦必定建立于他人的不快之上)。懦夫对决里,若有一方执意继续较量,另一方就很难中止对决,一旦中止会被看作是怯懦,从而陷入进退两难的境地。在这种状况下,选择冒险并取得胜利的一方,其获得的好处是建立在对手的损失之上的。如果假设对决的参与者中,一方是鲁莽且不计后果的类型,另一方则是足够明智的决策者kaiyun全站app登录入口,那么鲁莽的一方很有可能成为对决的赢家。多次进行这种胆怯型博弈,勇于向前且成功的参与者会更有信心在未来继续使用这种策略,他很可能因此形成一种强硬的作风,让对手在未来的较量中感到畏惧,从而为自己带来利益。接下来要阐述的一个商业竞争案例,似乎很贴切地说明了这个观点。懦夫博弈中,粗野姿态有益处,以故事形式展现如下:二十世纪七十年代,通用食品与宝洁的竞争期间,通用食品公司运用了无礼和强硬的手段,最终赢得了这场对抗。那个时期,美国通用食品企业和宝洁公司均制造非速溶咖啡,通用食品的Maxwell House咖啡在东部市场占有率高达43%,宝洁的Folger咖啡则在西部销售额最为突出,1971年,宝洁在俄亥俄州积极投放广告以拓展东部市场,通用食品迅速加大了该地区的广告宣传力度,并且显著降低了产品价格。宝洁公司停止在该区域的活动后,通用食品公司也减少了当地广告开支并调高了价格,利润回升至降价之前的数值。宝洁企业随后在两家企业共同占据市场的中西部城市约翰斯顿加大宣传力度并调低售价,意图迫使通用食品企业退出那个区域。对此,通用食品企业则选择在堪萨斯地带降低价格进行反击。经过几番较量,通用企业树立起一个强悍报复者的形象,这实际上向其他行业传递了一个信息:任何想要与我争夺市场的对手,都将面临毁灭性的对抗!在那之后,多数企业都选择不再与通用食品公司争夺市场份额,4.3 懦夫博弈---粗犷形象的价值 这个案例能带给我们哪些启示?通用食品公司这种看似自毁的报复行为,其实和懦夫博弈里的某个策略非常相像。它通过大胆运用这种战术,不仅成功牵制了对手,还让对手因为恐惧而选择退缩。20世纪最具危险性的冲突出现在1962年10月,具体而言,当时苏联试图在古巴部署具备核弹头的导弹,这一举动引发了严重的对抗。肯尼迪总统在10月14日得知导弹消息后,便组建了一个特别决策小组来研究应对措施,经过一番讨论,决策小组的选项简化为两个:实施海上禁运或者发动空中打击。与此同时,苏联的赫鲁晓夫也面临两种可能的决定:撤除导弹装置或者继续部署。从博弈论角度,能描述出古巴导弹危机局面,参考图4-7。11 采取让步措施 -22 苏联取得最终胜利 2-2 美国获得最终胜利 -4-4 发生核冲突 苏联 美国 实施封锁 撤除封锁 保留封锁 发动空袭 4.3 胆怯者博弈---古巴导弹危机 图4-7 展示了四种潜在情形:彼此让步、苏联成功、美国成功或引发核战争 分析这个博弈的构造 可以看出它与胆怯者博弈完全一致画线法能够揭示该博弈的纳什均衡分别为两种组合,即一方实施空袭并另一方拆除,或一方实施封锁并另一方保留。然而,历史上实际发生的情况是双方选择封锁与拆除,这一结果并非纳什均衡所预测的。对于这个情况,我们或许可以理解为实际博弈的构造并非像我们描述的这么单一——参与者权衡的选项或许远超图4-7所展示的策略;又或者可以理解为双方都留有某些未言明的空间,因此达成了一种彼此让步的结局。不过,在后续章节探讨混合策略时,我们将提供一种不同的阐释,历史的进程也有可能仅仅是某个偶然事件的产物。协调博弈属于不同于性别战和懦夫博弈的博弈类型,双方在此类博弈中存在一致偏好的均衡点,一个公司正考虑选用新的内部电邮系统或内部互联网系统,同时供应商也在考虑生产何种产品,双方的选择包括构建技术领先的平台,或者建立操作便捷的基础设施我们假设更高级的系统确实能提供更丰富的作用,因此两个参与者的收益——用户支付给卖方的净金额,如图4-8所示: 4.4 协调博弈 图4-8 协调博弈 2020 00 00 55 用户 卖方 高级 普通普通 普通高级 4.4 协调博弈 可以看出,假如构建了高级系统。两个参与者的最终收益都会有所改善,尽管现实未必总是这样,这只是假设在当前决策下会如此。最坏的情况可能是,一个人决定采用新系统,而另一个人却继续使用旧系统。那样一来,就不会有任何交易达成,自然也就没有盈利。为了让彼此协作,供应方与需求方需要确定一个共同的规范,这个规范就是战略选择,所以他们的战略必须保持一致。运用划线方法,可以找到两种纳什均衡——(领先,领先)和(普通,普通)。但如果他们能够低成本地交流,我们推测(领先,领先)会比(普通,普通)更可能成为实际发生的纳什均衡。由于一方提议优先选择,另一方会同意,因为对方接受提议同样是最优选择,4.5 多重均衡中最有可能出现的情况 在本章的案例分析中,我们了解到许多博弈场合会出现多种均衡状态多重均衡削弱了博弈的分析价值,一方面,我们难以确定哪个均衡会形成,另一方面,现实中实际发生的情况很可能并非均衡状态,例如麦琪的礼物和古巴导弹危机的实际发展并非均衡状态。然而,为博弈补充特定的情境信息,或许我们依然能够合理判断哪些均衡结果更有可能形成。博弈领域的部分学者给出了若干种推测途径。4.5 在多个均衡情形下最有可能出现的情形 ---焦点 非数学博弈学领域的托马斯特林主张,在现实生活场景里,博弈各方能够借助某些被博弈框架忽略掉的资讯来达成一个关键点均衡。某个位置之所以称作“焦点”,是因为博弈各方的文化背景和过往经验让他们确信这个位置是大家容易联想到的,惯常挑选的位置。比如在胆小鬼博弈里,倘若开车的人丙是冲动型,开车的人丁更冷静,这个状况双方都明白,那么开车的人丙“直行”而开车的人丁“转弯”就会是一个焦点均衡。在图4-5所描绘的团体中的权力博弈里,假如领导是强硬派,而部下是温和派,那么可以料想(强硬,顺从)就是一个焦点均衡。谢林的《冲突的策略》提出了聚点均衡的概念,这本书是博弈论领域的重要著作,里面没有运用任何数学公式或符号,而是通过大量实例进行阐述。4.5节讨论了多重均衡现象,其中聚点是特别值得关注的一种情况。不妨设想一下,你和各位参与者都要从以下一组数值中挑选一个,并在上面画圈:7,100,13,261,99,666。如果你们最终选出的数字完全一致,那么你们将获得更高的收益。你倾向于挑选哪个数字?谢林注意到选取七是最普遍的做法,然而在那些欲望强烈的人群里,六百六十六同样可能吸引众人关注。博弈论在生活经济学中的应用 第四回探讨最优对策、纳什均衡及数个典型情形 1. 最优对策与纳什均衡 2. 电视频道中的性别对抗 3. 胆小者博弈 4. 协调博弈 5. 多重均衡下最易出现的情形 6. 缺乏单纯策略均衡时的结局 7. 本节要点 我敬重你源于你对我表示尊重,你尊重我因为我也重视你; 我欣赏你由于你也欣赏我,你欣赏我由于我对你有好感; 我倾慕你因为你也爱慕我,你爱慕我由于我对你怀有爱意。某个沙滩只有一米宽,上面零星散落着一些游客。每个游客都要买一瓶水。来了两个卖水的人。如果每个游客都只去距离自己最近的那个人那里买水,那么这两个卖水的人应该把他们的摊子放在什么位置呢在这个游戏中,两个商贩会意识到,若他们停放在沙滩中心左侧或右侧的任何地点,情况都不理想,因为对手只需将自己的摊位设在自己旁边右侧或左侧,就能吸引超过一半的游客光顾,而他们自己吸引的游客则不足一半。唯有将自己的摊位设置在沙滩的绝对中心,才是最优选择。这种情形下,不论对方在自身左侧邻近还是右侧邻近,自身总能吸引一半游客,其他方位都无法获得如此高的客流量,所以两个小贩就把摊位紧挨着,都设置在沙滩正中央 这种以“长滩卖水”为名的策略,同样适用于政治选举中拉选票活动的剖析,也能说明为何售卖同类商品的商家纷纷聚集在一起经营然而,我们举这个例子意在阐释纳什均衡—本章的核心内容:究竟何种策略配对能让博弈双方达成一个稳固的结局,比如两个商贩最终形成稳定的摊位分布情形。4.1 最优应对与纳什均衡 囚徒博弈里存在优势策略纳什均衡(双方都采用优势策略),智猪博弈中则有依次排除劣势策略纳什均衡(其中一方占优,另一方不占优)。然而,许多对局情形里,每个参与者均无优势策略,自然也谈不上劣势策略。以那个称作“麦琪的礼物”的对局为例,我们该如何寻找它的对局均衡点呢? 4.1 最优对策和纳什均衡 故事框架…………………………………………… “麦琪的礼物”对局源自欧·亨利同名篇章。小说讲述了一段这样的经历:一对生活不宽裕的伴侣,男方吉姆珍爱一块没有表带的手表,女方拥有一头漂亮的长发却缺少一把玳瑁发梳,两人感情真挚,日子过得称心如意。圣诞节前夜,他们各自偷偷出门为对方挑选礼物。女方忍痛卖掉了自己的秀发,给男方购置了一条表带,以便搭配他的手表;男方则变现了心爱的手表,为女方买来一把梳子。我们借助损益矩阵来呈现博弈框架,将这个叙事转化为博弈模型可以展示为:图4-1麦琪的礼物 00 21 12 00 配偶 剪发 不出售 出售 表现者 不出售 4.1 最优对策与纳什稳定点 查看这个博弈,矩阵中的数值是如何构建的?若男士出售了手表而女士修剪了头发,那么双方赠送的礼物均失去意义,彼此的收益均为零;倘若男士未售出手表且女士未剪发,双方同样缺乏购买礼物的资金,各自的效用依旧为零;当男士出售手表而女士未修剪头发,或男士未售出手表而女士剪发时,其中一方能够购买礼物赠予对方,由于他们感情深厚,赠予者可获得两个单位的效用,接受者则能获得一个单位的效用。这个博弈的最终稳定状态是什么?由于无法再找到任何优势策略,必须探索其他方法来寻找稳定状态。值得庆幸的是,确实存在这样的方法,即依据纳什均衡的概念来求解。4.1 最优反应与纳什均衡-- 4.1.1最优反应 4.1.1 最优反应 我们首先要说明最优反应的概念。最优反应是指,当对手确定某个策略时,选择某个特定策略比选择其他任何策略都要更有利,那么这个特定策略就是针对对手选定策略的最佳应对。比如在图4-1的博弈情形下,妻子选择剪发时,丈夫的最佳应对是不出售手表,因为出售手表只能获得零点收益,不售手表却能拿到一个单位的收益,为了标示出丈夫的最佳应对,我们在图4-2中对应于(不售手表,剪发)的格子里,把丈夫的收益数字“1”划上一条横线;妻子若不剪发,则丈夫的最佳选择是出售手表,同样,为了标明丈夫的最佳选择,我们在(出售手表,不剪发)的格子里,把丈夫的收益数字“2”划上一条横线。同然,也能识别出妻子针对丈夫所有策略的最佳应对,若丈夫决定出售手表,妻子最佳选择是不去修剪头发;倘若丈夫选择不出售手表,妻子最佳行动是去修剪头发。为了标示妻子的最佳应对,也在对应格子里妻子收益数值下方划上一道横线(参见图4-2)。4.1 优势策略与均衡点-- 4.1.1 优势策略 图4-2:麦琪的礼物 00 21 12 00 配偶 不理发 理发 不出售 出售 伴侣 4.1 优势策略与均衡点-- 4.1.2 均衡点 4.1.2 均衡点 均衡点是一种情形,在这种情形下每位参与者选定的方案都是对其他参与者方案的最佳应对。以两人较量为例,纳什均衡即是一种策略配对,包含一方的策略与另一方的策略,其中一方的策略是对另一方策略的最佳应对,另一方的策略同样是对一方策略的最佳应对,比如在囚徒困境较量中,我们称(一方招供,另一方招供)构成纳什均衡,就是因为它符合纳什均衡所具备的条件——一方招供是对另一方招供的最佳应对,另一方招供也是对一方招供的最佳应对。 * * *