与博弈有关的理论称博弈论(GameTheory),。
博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。
什么是博弈论?古语有云,世事如棋。
生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。
博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统化为一门科学。
换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。
事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。
数学家们将具体的问题抽象化,通过建立自完傅穆呒�蚣堋⑻逑笛芯科涔媛杉氨浠�U饪刹皇羌�菀椎氖虑椋�宰罴虻サ亩�硕赞奈���韵胍幌卤阒�酥写笥行�睿喝艏偕杷�蕉季�返丶堑米约汉投允值拿恳徊狡迩叶际亲睢袄硇浴?的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…。
面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。
对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。
在这里抽象化后的博弈问题是,已知参与者集合(两方),策略集合(所有棋着),和盈利集合(赢子输子),能否且如何找到一个理论上的“解”或“平衡”,也就是对参与双方来说都最“合理”、最优的具体策略?怎样才是“合理”?应用传统决定论中的“最小最大”准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对於每一个二人零和博弈,都能够找到一个“最小最大解”。
通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。
当然,其隐含的意义在於,这套最优策略并不依赖于对手在博弈中的操作。
用通俗的话说,这个著名的最小最大定理所体现的基本“理性”思想是“抱最好的希望,做最坏的打算”。
虽然二人零和博弈的解决具有重大的意义,但作为一个理论来说,它应用于实践的范围是极其有限的。
不提耽于游戏的玩家,可以说除了军事竞争,几乎难再有用武之地。
二人零和博弈主要的局限性有二,一是在各种社会活动中,常常有多方参与而不是只有两方;二是参与各方相互作用的结果并不一定有人得利就有人失利,整个群体可能具有大於零或小于零的净获利。
对於后者,让我们来看一个历史上最经典的有趣个例:“囚徒困境”。
话说警方抓到两个盗窃犯,惜证据尚不足,遂寄希望于嫌犯自己招供。
警方把两个犯人隔离起来,分别审问,交代政策如下:坦白从宽,抗拒从严!如果你招了,另一个人没招,那么就将你释放,另一人判20年;同样如果你不招,另一个人招了,那么你得被判20年,另一个人被释放。
如果两个人都招,警方证据就足了,两人都判10年。
至於两个人都不招的情况,不用警方交代,两个人都得判,但因证据不力,判得都要轻许多,比如1年。
警方最后说,那边还有个警察,对你的同伙交代一模一样的政策呢。
罪犯心里打起小九九,如果对方招了,我招是10年,不招是20年,是招划算;如果对方不招,我招是无罪释放,不招是1年,还是招划算。
於是乎,招!两个“精明”的小偷都招了,都被判了10年,正中警方下怀。
聪明的读者,其实如果两个小偷都不招,就会被各判1年,对他们来说岂不更好?在这个囚徒困境问题中,参与者仍是两名(两个盗窃犯),但这不再是一个零和的博弈,人受损并不等於我收益。
两个小偷可能一共被判20年,或一共只被判2年。
对於多人参与、非零和的博弈问题,在纳什之前,无人知道如何求解,或者说怎样找到类似于最小最大解那样的“平衡”。
而找不到解,下面的研究当然无法进行,更谈不上指导实践了。
纳什对博弈论的巨大贡献,正在於他天才性地提出了“纳什均衡”的基本概念,为更加普遍广泛的博弈问题找到了解。
纳什均衡的基本思想是,在这个解集中所有参与者的策略都是对其他参与者所用策略的最佳对策,没有人能够通过单单改变自己的策略提高收益。
以前面的囚徒困境为例,如果小偷甲相信小偷乙招供,那么他的最佳策略是招供,而如果小偷乙相信小偷甲招供,那么他的最佳策略仍是招供。
这就是一个纳什均衡,它是“自确定”的。
在囚徒困境中,只存在一个纳什均衡。
但若将条件改变一下,在许多其它的具体问题中,纳什均衡可能不止一个。
纳什巧妙地运用数学技巧,证明了如下纳什定理:对於任何一个n人参与,非合作博弈(零和或非零和),如果每个参与者都只有有限条策略,那么一定存在至少一个纳什均衡解集。
象许多科学上最杰出的思想一样,这一概念以极简洁明了的方式解决了悬而未解的难题。
看似简单,似乎属於那种“本来我也能想到”的东西,然而那时除了纳什,一代宗师诺伊曼也没有想到。
纳什均衡的提出,对博弈论的发展产生了革命性的影响,纳什均衡的概念已成为现代博弈论的基石和中心(虽然在少数博弈理论家中此点仍有争议)。
纳什的好友,普林斯顿大学经济学教授迪克西特曾说,“如果每次有人说起或写下纳什均衡这几个字,纳什都能拿到一块钱的话,那么他现在会是个大富翁了!”。
上面提到的博弈理论试图解决的都是非合作型问题,也就是参与者之间除了决策结果相互影响,没有其它形式的信息交流。
通过囚徒困境一例可以看出,如果参与者两个小偷之间能够彼此商议,他们做出的策略决定会截然不同(当然是两人一起抵赖划算)。
诚然,在各种生活行为中,人与人之间除了竞争关系,还存在合作关系,常常是两种关系并存,合理的合作能够给双方带来共同利益。
这是合作型博弈论研究的范畴。
诺伊曼在《博弈论与经济行为》一书中建立了合作型博弈论的基本模型,但是对於其中及其重要的双向协商问题(即参与者如何“讨价还价”),没有能给出一个确定的解。
纳什对这一领域同样做出了卓越贡献,他不仅提出了讨价还价问题的公理化解法,直接裨益劳动经济和国际贸易,还在理论上利用这个解法良好的预测性进一步提出纳什方案:将合作型博弈中的协商转化为一个更广泛的非合作型博弈的一个步骤--协商的目的最终仍是最大化自己的利益。
此外,在测试博弈论的行为实验学上,纳什也是一名先驱。
他曾展开讨价还价和联盟形成的实验,并曾敏锐地指出,在其他实验者的囚徒困境实验里,反复让一对参与者重复实验实际上将单步策略问题转化成了一个大的多步策略问题。
而后一思想初次提示了后来发展起来的在经济和政治领域起重要作用的重复博弈理论中缄默共谋的可能性。
这些也许看起来略显枯燥的理论,以逻辑推理为工具对人们日常生活中的竞争和合作行为进行严谨有序的数学归纳,当数学家们孜孜不倦地将直觉上升为科学,再反作用于生活时,其影响之深远难以尽述。
今天,纳什为之做出基础性贡献的现代博弈理论经过许多专家的不断发展,不仅自身理论体系日臻成熟和完善,而且被广泛应用于经济学、政治学、军事学甚至生物学等各个领域。
在生物学领域,博弈论被用于研究种族遗传学和进化生物学中种间和种内的竞争,以及单个基因之间的竞争,并反过来推动博弈论的思想发展。
在政治、军事学领域,博弈论被用于分析选举策略、战争起因、立法议程安排等等重大事宜。
在经济学领域,博弈论更是已经融入整个学科的主流,经济学教材和杂志无不收入博弈论的内容,经济学家们已经把研究策略相互作用的博弈论当作最合适的分析工具分析各类经济问题,诸如公共经济、国际贸易、自然资源经济、工业管理等等,等等。
就博弈论应用于经济学的直接效益,举个实例,如《美丽心灵》一书中提到,1994年美国政府向商家拍卖大部份电磁波谱。
这一多回合拍卖由一批博弈论专家本着最大化政府收益和各商家的利用率原则精心设计,取得极大的成功。
政府获得超过一百亿美元的收入,各频率的波谱也都找到了满意的归宿。
与此相对映的是,新西兰一个类似却没有经过博弈理论设计的拍卖会惨遭失败。
政府只获得预计收入的15%,而被拍卖的频率也未能物尽其用。
譬如因为无人竞争,一个大学生只花1美元就买到了一个电视台许可证!正因为博弈论对现代经济学具有如此重大的冲击和影响,1994年瑞典皇家学院宣布该年全世界科学家的最高荣誉诺贝尔奖之经济学奖颁发给包括纳什在内的三位数学家,以表彰他们对非合作型博弈论的开拓性分析。
今年的诺贝尔经济学奖项就是博弈论在经济学中的应用成果
纳什均衡公式
纳什均衡的思想是,当参与者选定的策略组成纳什均衡后,就会形成一个平衡的局面。
在这个平衡的局面中,任何一个剧中人单方面地改变自己的策略,只能是自己的收益下降(或不变),绝不可能使自己的收益增加。这样,在纳什均衡下构成的这种局势让每个参与人都不敢轻举妄动,因而形成了这个平衡。
纳什均衡并不是为了集体的利益最大化,而是为了个人的利益最大化。所以在为了个人利益最大化的同时,一定会损耗集体的利益。因此纳什均衡点不一定(大多情况下都不是)是集体利益最大化点。
举个经典的例子:囚徒困境,两个囚犯抓起来之后,分别单独审问,如果都承认罪行就都判刑7年,都不承认就判刑2年,如果一个承认一个不承认,不承认的判刑10年,承认的由于表现良好所以直接宽大释放。
这个例子中很明显,如果大家都不承认是最好的结果(可以算是整体利益最大的结果),都承认是最坏的结果,但是这个最坏的结果却是纳什均衡的结果。为什么呢?
是因为在纳什均衡下,他们都承认都获刑7年,但是如果有一方选择不承认,他就有获刑10年的可能性,所以他们都不愿意冒这个风险,宁愿获刑7年,最终形成了这个纳什均衡。
我只是浅显的说了一下纳什均衡的道理,如果想了解的更深刻,比如纳什均衡点的分类、公式什么的最好还是系统的学习一下《博弈论》这门学科比较好。
还没有评论,来说两句吧...