什么是博弈论?
博弈,顾名思义,由“博”与“弈”两字组成。它指的是双方或多方的对抗或竞赛,这种对抗或竞赛是在既定规则约束下进行的。参与者必须思考并运用相应的策略或计谋,目的是为了争取最终的胜利。
博弈论设计甚广,后续发展基本上沿着以下4个方面展开:
对 纳什均衡 的弱化(或一般化)研究
对 纳什均衡 的精炼(或筛选)研究
对 博弈论 的基本假设的深入研究
对 博弈论 的应用研究
实际上,博弈论已经超越了仅限于经济领域的探讨,它已经扩展到了对社会问题的深入研究kaiyun.ccm,并在政治学、社会学、管理学等多个非经济学科领域内得到了广泛的运用。
鉴于博弈论在理论领域的核心地位,我针对《博弈论》这部著作进行了详细的笔记整理,深信博弈论在阐述冲突、构建合作、加强信任以及推动社会经济进步方面将发挥关键作用的重要理论。
文中讲述了多种博弈模型,贴近生活也耐人寻味。
一、概览 1)博弈类型和结构化思维
科学的起点是分类,只有通过分类才能区分事物之间的不同。
服饰需分门别类,图书亦需区分种类,甚至身高、收入、智商等众多方面均可进行归类。通过分类,事物方能井然有序。
博弈的分类有两种:
静态博弈 和 动态博弈
完全信息博弈 和 不完全信息博弈
静态博弈和动态博弈
以上推演到实际生活中:
石头剪刀布、投标活动就是 静态博弈
棋牌游戏、拍卖就是 动态博弈
有个实实在在的例子:
学校在课程落幕之后,通常会要求学生们对教师的授课进行评价,同时教师也需对学生的学业成绩进行评定。若学生先行进行评价,这或许会对教师评定成绩产生一定影响;反之,若教师先行评定,也可能对学生进行课程评价造成干扰。如此一来,教师与学生在评分过程中便形成了相互制约的关系,使得评分的真实性和有效性难以得到保障。因此,我们需采用保密措施,学生先行进行评分kaiyun全站登录网页入口,而对教师则保密处理;教师需在完成学生成绩评定之后的一段时间内,方可得知学生对其的评分。此过程形成了一种静态博弈状态。
两者区别:
在静态博弈中,参与者需根据对敌方策略或行为的预设来进行决策,例如在“石头剪刀布”这一游戏中,你需设想对手可能会出“石头”,随后你将据此选择自己的出拳方式“布”。
动态博弈 的参与者则是依据对手的实际选择做决策。
完全信息博弈与不完全信息博弈
以上推演到实际生活中:
教育、医疗和金融就是 不完全信息博弈
相较之下,完全信息博弈极为罕见,这实则揭示了生活的本质——它本就充满了不公。
结构化思维
若某物能够根据两个或以上的不同标准进行归类,那么将这多个标准合并于同一平面之上,便能够形成一种系统化的组合模式。
将上面说到4种博弈类型进行组合,我们可以得到:
2)扩展认知 纳什均衡
均衡是指所有博弈参与者的最优策略组合。
纳什均衡的内涵在于:在你采取某种策略的情况下,我选择的策略将是我所能做的最优选择之一;同样,在我选定策略的前提下,你所采取的策略也将是你认为的最优选择之一。在这种相互设定的策略中,双方均不再有动机去改变自己已定的策略。
总之,双方关系已降至冰点,彼此均不愿调整各自既定的策略方针。
策略探究
策略的三大属性:
1、策略的完整性
策略必须全面无缺,这要求参与者对每一种可能的情况都进行详尽的思考,确保不留任何疏漏(需擅长运用分类与穷尽法)。
2、策略的多样性
策略种类繁多kaiyun官方网站登录入口,这表示你实际上拥有众多策略可供挑选,比如A、B方案,亦或是保留后手,确保有所准备。
3、策略的不可观察性
策略与行动有所区别,行动指的是具体实施的措施,而策略则是对这些行动的预先设想。仅凭一个人的具体行为来推断其策略,可能会出现偏差(你所认为的,未必就是真相)。
共同知识
什么是共同知识呢?
《皇帝的新装》这个故事广为人知,然而,皇帝并未着装,这一点是众人皆知的普遍事实,却并非普遍共识。普遍共识指的是每个人不仅知晓(普遍性),而且还清楚他人亦知晓,并且明白每个人都知晓这一点……
我们通常提到的共识,实际上指的是共同知识。这两个概念需要我们明确区分。这不禁让我联想到互联网上广为人知的“两将军问题”,TCP为何要执行三次握手而非两次?其目的就是为了确保共识的达成。
二、经典模型
1)懦夫博弈
狭路相逢勇者胜 就是一种博弈,双方都在赌对方先退一步。
提及此类竞争,《速度与激情》电影中诸多片段均是对懦夫博弈的生动反映。
在懦夫博弈场景中,存在两位参与者A与B,他们各自拥有两种可供选择的策略或行为:前进或后退。双方可能遭遇的四种不同结局包括:两人均选择前进、两人均选择后退、A选择前进而B选择后退、以及A选择后退而B选择前进。
懦夫博弈中,先行者占据优势,若一方决定进攻,另一方便只能选择撤退,否则将面临更为严重的损失,这便是常说的“先发制人,后发则受其害”。
理论上分析,在懦夫博弈中取胜的关键在于:首先主动作出前进的选择,紧接着要迅速告知对手自己已选定前进,并且确保对手明白这一决定不可更改。
一句话中,体现了三要素:
因此,在懦夫博弈中,先动者的优势既源自于行动上的领先,亦源于信息传递上的优势。
赢者独占鳌头的现象容易引发激烈的竞争,在这样的较量中,人们需不断评估自己获胜的机会,通常情况下,选择不参与这种竞争是一种明智的选择。
2)夫妻博弈
夫妻间的博弈可谓不断,明年过年去谁家也成为了世纪难题。
在这个问题的情境之下,双方的利益得到了共享。在夫妻间的博弈过程中,我们可以观察到两种纯粹的策略纳什均衡:要么双方一同前往男方家过年,要么双方一同前往女方家过年。
从现实生活中分析,一般有三种情况:
与懦夫博弈一样存在先动优势,家庭地位决定纳什均衡的偏好
轮流去对方家
随机挑选出的策略,其效果甚至超越了纳什均衡,双方均遵循着彼此认同的规则。
在合作开始前明确收益分成方案:在各类合作关系中,收益分配是一个不可避免的问题。各种分配方式都有其合理性,但最为关键的是,在合作启动前双方能够自主达成一致,这样的做法能显著减少合作过程中的成本。
夫妻间的博弈体现为一种双方都能获得利益的合作关系,然而在共享合作成果的分配过程中,各方的所得不尽相同。通过事前明确约定收益的分配方式,能够有效预防矛盾和冲突的发生。
3)囚犯困境
囚徒困境,亦称作“囚徒困境”,是博弈论领域内最著名的理论模型之一。
囚犯困境在当代电视剧中频繁出现,其基本情节通常是这样的:两名罪犯被分别提审。若他们均选择缄默不语,最终只能依据犯罪事实进行定罪,所面临的刑罚相对较轻。然而,若其中一人选择率先坦白,那么他便能即刻获得释放,而另一位罪犯则需承担更为严重的罪行。若双方均选择坦白,则两人均无法获得释放,并且还将面临更重的处罚。
此时,囚犯困境显现,两人若都选择抗拒,那将是他们最理想的结果;然而,对个人而言,选择率先坦白,却成为了一种更优的应对之策。
该策略具有明显优势:无论其他参与者如何选择,采用此策略的后果均优于其他选择。当博弈中的每位参与者均采纳各自的占优策略时,所形成的平衡状态即称为占优策略均衡。
在双方无法进行交流的特定情境中,一旦条件得到放宽,双方被允许共同停留十分钟后,方可作出是否选择坦白的决定。
那么,此刻的博弈焦点将转向双方是否恪守承诺;当然,最理想的策略依旧是不履行承诺;而最终的结局亦将取决于某一方是否能在心理上确保不会单独背弃对方。
现实生活里,囚犯困境现象普遍存在。人们普遍认为,这种困境的成因在于个体对个人利益的追求,因而,在利益存在分歧的场合,往往便会出现囚犯困境。那么,我们该如何摆脱这种困境呢?
积极调整游戏规则,竭力探寻每位参与者的最佳策略,即便不能做到对他人有所增益,至少也要确保双方都能从中获益。
我们渴望道德的指引。若缺乏某种道德规范来规范人的行为,人类社会将和动物界别无二致。
借助历史的记忆。把对历史的记忆转为对未来的想象
囚犯困境的根本问题在于,个体在追求自身利益的同时,往往导致他人利益的巨大损失。
囚犯困境所启示的真理是:博弈的最终平衡状态并非由实际情况所决定,而是完全由博弈的规则所决定。
4)万元陷阱
这个博弈带来了一个十分有意思的案例:
存在一款名为《美元拍卖游戏》的活动,其中,苏必克将一张1美元的纸币作为拍卖的物品,公开进行竞拍。竞拍的规则规定,出价最高者将获得该物品,而第二高价的竞拍者也需支付其出价金额。
这究竟是怎么回事呢?简而言之,我们将以10000元作为拍卖的起始金额,邀请各位参与竞拍,每次加价不得少于100元。竞拍将持续进行,直至无人愿意继续提高价格。最终,出价最高者将获得这10000元,而次高者则需要按照自己的出价数额支付给我相应的金额。
若在场的所有人都未参与拍卖,你仅需投入100元,便有机会获得价值10000元的物品,届时你的收益将达到9900元。
当然,这是最理想的结局。但若出现两人竞相抬价的情况,当你报价至1000元时,对方却出到了1100元,你将如何抉择?若你选择放弃,将损失1000元。唯一的策略就是继续提高报价。如此一来,竞争愈发激烈。当你报价至9900元时,对方已出至10000元。此时,双方均不愿放弃,于是继续竞相加价,直至其中一方破产。
这就是著名的 万元陷阱 ,这些陷阱通常有三个特征:
一个明显的诱饵
通往诱饵之路是单向的,可进不可出
参与者越是渴望摆脱束缚,反而越会陷入其中,难以自拔,最终不得不承受沉重的损失。
那么如何避免 万元陷阱?
确立你投入的极限及预先的约定
极限一经确立,就要坚持到底,一定不要轻易改变
自己打定主意,尽量不受他人影响,避免出现 从众心理
不断提醒自己继续投入的代价
竞拍过程中,切莫抱有不切实际的幻想,切勿一开始就标出9900元的高价,这样的利润仅100元,通常情况下,鲜少有人会继续抬价,除非是出于恶意。然而,若真有人将价格加至10000元,你若选择跟进,便需展现出决断力,毫不犹豫地从9900元直接提升至19900元。这样,对方便能明白,若他们再加价至20000元,不仅会损失10000元,若选择放弃,同样也会损失10000元,而且若他们继续加价,损失还将进一步扩大。
要想规避万元陷阱,最关键的举措是果断止损,切莫被其深陷其中;其次,切勿怀揣侥幸心理,以为天上会掉馅饼;只有利益微小,才能避免激起他人过度的嫉妒与觊觎之心;否则,一旦利益丰厚,难免会引来贪婪之徒。
5)智猪博弈
什么是智猪博弈呢?经典模型如下:
在猪圈中,一头猪体型庞大,另一头则相对瘦小。猪圈的其中一边摆放着食槽,而另一边则装置了调节饲料供应的开关。每按一次这个开关,食槽中便会增加10单位的饲料,然而,每次按下开关所付出的代价是消耗掉2单位的饲料。
若两头猪同时按下按钮并一同奔向食物,那么体型较大的猪将获得7个单位的食物,而体型较小的猪则能分到3个单位。扣除所需成本后,大猪的净收益为5个单位,小猪的净收益则为1个单位。
若大猪触动按键,而小猪正位于食槽边等待进食,此时大猪将获得6个单位的食物,小猪则能分得4个单位。扣除相关成本后,大猪和小猪各自获得的净收益均为4个单位。
若小猪触动按钮,而大猪正站在食槽边等待进食,那么大猪将能获得9个单位的食物,而小猪则只能得到1个单位。扣除所需成本后,大猪的收益为9,小猪的收益则为负1。
显而易见,对小猪而言,等待是更为有利的选择。既然小猪必然选择等待,为了能够获得食物,大猪不得不遵从。在这种情境下,所形成的纳什均衡便是(大猪遵从,小猪等待)。
然而,这种平衡对体型较大的猪来说并非最佳选择,因为付出多并不一定能获得更多,最终的结果是(大猪:4,小猪:4)。在当前的竞争模式里,小猪无论如何都不会按下按钮,大猪是否按下按钮仅会影响到小猪的得失,而不会对小猪的策略或行为决策产生影响。
因此,此类模型亦被称作搭便车博弈,其中一方承担了相应的成本,而双方共同享有取得的收益。借助这一模型,我们可以获得以下几点启示:
个体与集体的理性是否对立,抑或彼此协调,这一问题的答案在于制度设计的本质。
收入分配的不均衡现象,往往会导致个人理性与集体理性之间的矛盾加剧。换句话说,通过让一部分人率先富裕起来,实际上能够对那些尚未富裕的人群产生一定的帮助作用。
富裕人士乐于施善,这一行为亦得益于贫困者的认可。若要促使那头大猪按下按钮,另一头小猪可以自愿减少自己的食量,以此来减轻大猪可能感受到的不公平感。
能力越大,责任越大
在猜谜博弈中有两个非常重要的概念:纯策略 和 混合策略
纯策略: 参与者在每一个给定信息情况下只选择一种特定的行动
在已知信息的前提下,参与者会按照一定的概率分布,随机挑选各自采取的行动。
例如,“若对方不侵犯我,我便保持克制;但若对方侵犯了我,我必定会进行反击”这属于一种纯粹的策略。“若对方不侵犯我,我有八成的概率不会反击;而若对方侵犯了我,我有九成的概率会进行反击”则是一种混合策略。
6)猎鹿博弈
又是一个有趣的博弈模型
两个人出去打猎,猎物为鹿和兔。
情况1:如果两个人独自去打兔子,一天下来可以打到2只兔子
若欲猎捕鹿群,务必两人同行,缺一不可。须知,一头鹿的价值等同于八只兔子,而每位猎手的价值亦等同于四只兔子。然而,若仅有一人前往狩猎,而另一人未能参与,那么那位单独行动的猎手将一无所获。
研究发现,在此模型中,存在两种纳什均衡状态,即要么集体狩猎鹿,要么集体狩猎兔子。
然而,若参与猎鹿,便需承担其中一人未能参与猎鹿的风险。在这种情形下,提前进行沟通便显得尤为重要。
若沟通所需费用低于预期收益,便需尽早进行交流,通过协作实现双方利益的最大化。沟通与协调的费用越少,人们之间建立合作关系便越加简便。