诺贝尔奖获得者奥曼和谢林:一切尽在博弈中 | |||||||||
---|---|---|---|---|---|---|---|---|---|
http://www.sina.com.cn 2005年12月06日17:30 《人物》杂志 | |||||||||
作者:张鑫 2005年10月10日,瑞典皇家科学院宣布,将2005年度诺贝尔经济学奖授予拥有以色列和美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林。作为当代博弈论“四君子”之一的罗伯特·奥曼,在国际经济学界早已是一颗耀眼的明星;而作为美国军事控制理论创始人之一的谢林,也为业内人士所熟知。
既陌生又熟悉的经济学大师 白须飘飘、脸上总是挂着微笑的罗伯特·奥曼,1930年6月8日出生于德国美茵河畔的法兰克福。1938年因逃避纳粹迫害,随全家迁到美国纽约。1950年奥曼从纽约州立大学毕业并获数学学士学位,又于1952年和1955年在麻省理工学院分别获得数学硕士学位和数学博士学位。 奥曼拥有以色列和美国双重国籍,是一名在以色列、美国乃至世界各地享有极高学术声誉的著名经济学家。他是美国科学院院士、美国艺术与科学学院外籍院士、以色列科学与社科院院士、英国社科院通讯院士,曾担任国际博弈论学会首任主席。目前仍担任耶路撒冷希伯莱大学数学研究院教授、纽约州立大学斯坦尼分校经济系和决策科学院教授,以及以色列数学学会主席、美国经济联合会荣誉会员等职务。 奥曼是一位谦和平淡而又直爽的老人。他在个人网站上介绍自己时,只有简单的一句话:“一个死了老伴,现在有5个子女、17个外孙和1个曾孙的老头子。”他说一不二,信守承诺,遵守时间,答应别人的事情一定会做到,也同样要求别人履行对他的承诺。奥曼还是一个虔诚的犹太教信徒。2002年他在青岛参加“国际数学家大会”期间,恰逢犹太教的礼拜日,奥曼硬是推掉了所有活动,把自己关在酒店的房间里整日闭门不出。 作为一名杰出的经济学家,奥曼在决策制定理性观点方面有着杰出的贡献,对博弈论和其他许多经济理论的形成起到了重要的乃至不可或缺的作用。因此,他曾于1983年获得了以色列技术机构颁发的科学技术哈维奖,于1994年获得以色列经济学奖。很长时间以来,奥曼还被广泛地认为是一位应当获得诺贝尔奖但却没有获得的经济学家。1994年,奥曼曾经以微弱的票数败给美国数学家约翰·纳什等三人,与当年的诺奖擦肩而过。今年的诺奖颁给奥曼,无疑是对他的最终肯定。 上个世纪90年代,博弈论开始进入中国经济学界的视野。许多人因此也较早地认识了国际知名的博弈论专家奥曼。在2001年中国经济出版社出版的《挑战诺贝尔奖的经济学大师们》中,就较详细地介绍了罗伯特·奥曼与托马斯·谢林对经济学的贡献。2002年,奥曼与约翰·纳什一同被山东青岛大学聘为名誉教授,并来到中国参加了由青岛大学承办的“2002年国际数学家大会”。获得诺贝尔经济学奖后,奥曼在回复《北京晨报》记者采访的邮件中,还没有忘记讲述自己的这次中国之行,并表示有计划再来中国。 被专业人士称为制度经济学和政治经济学大师的美国经济学家托马斯·谢林,1921年4月14日生于美国加利福尼亚州的奥克兰,1944年获得加州大学伯克利分校经济学学士学位,后又在该校获得硕士学位。1951年获得哈佛大学经济学博士学位。从1948年到1953年,他先后为马歇尔计划、白宫和总统行政办公室工作,1953年至1958年进入耶鲁大学,担任经济学副教授、教授。1958年被聘为哈佛大学经济学教授,第二年转到哈佛大学肯尼迪学院担任政治经济学教授,从事教学工作长达20年,并获得退休名誉教授的称号。1978年,他从哈佛大学辗转来到马里兰大学公共政策学院和经济系担任教授,同样获得退休名誉教授称号。他是美国科学院院士、美国艺术与科学学院院士、美国经济学会杰出会士。曾在1991年担任美国经济学会主席,1995年担任东部经济学会主席。 谢林是美国著名学者、经济学家,也是有限战争理论的奠基人之一,还是外交事务、国家安全、核战略以及军备控制方面的研究专家。因此,对于谢林这个名字,军事迷可能比经济学专业的学生们更加熟悉。 从上个世纪50年代开始,谢林的研究成果就已经应用于美苏冷战中。1962年的古巴导弹危机就是将谢林的博弈论应用在军事和国际关系决策上的绝佳范例,谢林也正是凭借这一事件,奠定了在军控理论、国际关系理论和博弈论中的权威地位。 是年,苏联在古巴设立进攻性导弹发射基地一事被美国发现,美国在仔细权衡前苏联的进攻可能性后最终决定派兵拦截。两国因为核武器事件一度对峙,最后以苏联的撤出告一段落。当时,美国预期能通过威慑解决危机,而苏联也因此得以体面地退出。谢林的研究工作,让威慑理论有了博弈论这一精确数学模型的支持。从某种意义上讲,称他是经济学家,还不如把他看成政治家或者军事家更为贴切。 奥曼和谢林的获奖再次 提升了博弈论的影响 博弈论是一门十分有趣但理论上又十分艰深的学问。所以,大多数人虽然对博弈论都有所了解,但又不能完全理解。由于博弈论是研究具有斗争或竞争性质现象的数学理论和方法,更确切地说是运筹学的一个分支,自然要用数学语言来表达,因而在外行人看来就是一大堆数学公式,看上去像“天书”。今年5月下旬,当凭借“非合作博弈”获得诺贝尔经济学奖的传奇人物纳什应邀出席“2005诺贝尔奖获得者北京论坛”时,出现了他在台上侃侃而谈,台下听众大皱眉头的局面也就不难理解了。 那么,究竟什么是博弈论呢?博弈论(The Game Theory)有时也被称为对策论,或赛局理论,奥曼则称其为“交互的决策论”。因为博弈论要研究的是决策者的行为发生直接相互作用时的决策以及这种决策的均衡问题,也就是人们之间的决策与行为形成的互为影响的关系。一个经济主体在决策时必须考虑到对方的反应,所以用“交互的决策”来描述博弈论应该比较简洁明了。奥曼还从经济主体的理性分析出发,认为博弈论是要研究交互式条件下的“最优理性决策”,即每个参与者都希望能以其偏好获得最大的满足。 博弈论中一个著名的例子就是囚徒困境。囚徒困境是一个非零和博弈,说的是两个嫌疑犯甲和乙私入民宅联手作案,被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私入民宅将各拘留1年;如果两人均招供,每人将被判刑5年。于是,两个人同时陷入招供还是不招供的两难处境。结果是,尽管甲不知乙是否招供,但他认为自己选择“招供”最好,因而甲会选择“招供”,同样乙也会选择“招供”,两人各判5年。而两人都选择不招供,虽证据不足但因私入民宅将各拘留1年的结果是不会出现的。 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。纳什均衡又称为非合作博弈均衡,是博弈论的一个重要术语,它是以美国数学家、日后成为电影《美丽心灵》主人公的纳什的名字命名的。在上述囚徒困境例子中,两个囚犯符合自己利益的选择是坦白招供。这种两人都选择坦白的策略以及因此被判刑5年的结局就是“纳什均衡”。 在博弈论中,还有这样一个小故事,叫“智猪博弈”。说的是猪圈里有一头大猪和一头小猪,它们共用一个猪槽。猪槽的另一头安装着控制猪食供应的跷跷板,踩一下跷跷板猪槽里就会掉进一定量的饲料。如果大猪去踩的话,它还能够在小猪吃完饲料之前赶来抢到一点饲料;如果小猪去踩的话,大猪在小猪回到食槽之前就已经把饲料吃完了,这样一来小猪什么也得不到,反而浪费了精力。在两头猪都有智慧的前提下,最终出现的局面将是,大猪乐此不疲地来回奔跑于食槽和跷跷板之间,小猪则选择守候在食槽旁边,坐享其成。这也是一个博弈模型。结论是,在一个双方共享的竞争环境中,有时占优势的一方最终得到的结果却有悖于他的初始理性。 类似于“囚徒困境”和“智猪博弈”这样的例子在人类的经济、社会、政治、国防、管理和日常生活中比比皆是。如价格战、军备竞赛、环境污染等等。可以说,几乎所有的决策问题都可以认为是博弈,一切尽在博弈中。 一般认为,对博弈论的研究始于策墨洛、波雷尔以及约翰·冯·诺伊曼。其实,具有博弈性质问题的研究还可以追溯到19世纪甚至更早。例如1838年的古诺简单双寡头垄断博弈模型。在中国古代文化中,也隐含着许多博弈论的思想。比如孙子兵法就指出,在国家之间的利益冲突中,最佳的决策不是一方将对方消灭,而是要避免两败俱伤,以求得长治久安的局面。中国古代军事家孙膑利用博弈论方法帮助田忌赛马取胜等等也属于早期博弈论的萌芽。 1944年,诺伊曼与奥斯卡·摩根斯特恩合作出版了《博弈论与经济行为》,概括了经济主体的典型行为特征,提出了标准型、扩展型和合作型等基本的博弈模型、解的概念和分析方法,奠定了经济博弈论大厦的基石,标志着现代博弈理论的创立。但是,诺伊曼的博弈论过于抽象,使应用范围狭窄,在很长时间里只是少数数学家的专利,因而影响力很有限。正是在这个时候,约翰·纳什于1950年提出了非合作博弈——“纳什均衡”,奠定了博弈论坚实的理论基础,使博弈论的发展进入了一个新的时代。随着纳什均衡的提出和不断完善,博弈论在经济学领域产生的影响越来越大。因为博弈论从一个独特的视角帮助人们更加深刻地理解和把握经济现象,对指导人们制定更加有效的经济政策具有重大的意义。 近十年来,博弈论被广泛应用到经济学、管理学、社会学、政治学、军事科学和其他社会科学的各个领域,博弈论者也成为了诺贝尔经济学奖的热门人物。1994年,诺贝尔经济学奖授予了对博弈论的发展做出了决定性贡献的美国数学家约翰·纳什、匈牙利裔美籍经济学家约翰·豪尔绍尼和德国经济学家莱因哈德·泽尔滕。这三个人也因此被称为当代博弈论的“三大家”。 奥曼和谢林之所以一同获得今年诺贝尔经济学奖,是因为他们“以博弈论分析方式增进了我们对于冲突与合作的理解。”具体到经济领域,是他们帮助“解释了诸如价格战和贸易战之类的经济冲突,以及为什么一些社区相对于其他社区在管理共有资源方面更为成功。”奥曼和谢林的获奖,无疑进一步提升了博弈论的地位和影响。 奥曼和谢林对博弈论的主要贡献 在过去的几十年中,奥曼对博弈论和经济理论的发展做出了重要贡献。他的研究具有与众不同的广度和深度,从博弈论基本概念的确立到理论研究工具与方法的发展、理论体系的形成及其在不同领域中的应用,都具有开创性的进展。可以说,奥曼对博弈论作了全面系统甚至可以说是包罗万象的研究。其代表作品主要有:《非原子型博弈的价值》、《博弈理论》、《博弈论讲义》、《不完全信息重复博弈》以及百科全书式的《博弈论及其应用手册》等。 奥曼首先是一位数学家,他对博弈论的研究是按照传统主流经济学的范式,沿着完全信息理论和数学表达的两条基本途径进行的。他在博弈论研究方面的主要成就有:构建和完善博弈论的基础问题,完全竞争经济模型的精确论证,使重复博弈论得到理论系统的发展等。 奥曼对以上问题的研究显示了他的数学才能。他用严格的数学模型证明了19世纪以来西方经济学的经典理论“完全竞争经济模型”、“为什么充分竞争是资源配置的最好方式”。众所周知,完全竞争经济模型描述的是,市场上存在众多参与者(居民和厂商),单个参与者决策的影响都是微不足道的,每个人只能接受既定的所有商品的价格。对此,奥曼将深厚的博弈论功底应用于市场的经济均衡研究,给出了市场力量根源的解释。奥曼认为,只要参与人的人数是有限的,单个个体对经济的影响,在数学上就不能忽略不计。一个适用于完全竞争经济概念的数学模型必须包含无限多个参与人。很显然,这时每个个体在模型中的影响的确可忽略不计。 奥曼最著名的贡献是在重复博弈上。重复博弈是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。奥曼发现,在很多现实情况中,长期合作关系的维系远比一次简单的际遇来得容易,因此短期博弈理论往往具有很多限制性。为此,他首先提出了完整详尽的无限期重复博弈理论,并严格论证了何种结果能够在长时期的关系中得到维持。 我们知道,囚徒困境只是一次性博弈,往往被用于说明“理性选择下的集体非理性结果。”奥曼认为这个观点太局限、太肤浅。如果两个小偷是在一个重复的博弈中,即他们反复面临选择的话,他们就会联合起来抵赖。因为抵赖的好处、未来的收益是可以“贴现”在眼前的博弈中的。于是,重复博弈导致了信任,导致了长期化关系,也导致了合作的可能。 奥曼对博弈论的研究成果大都是基础性的,并在经济学、数学和运筹学等许多学科领域内得以应用,比如一般均衡分析、最优配置、非线性系统、控制论、测度理论以及不动点定理等等。 由于主流的数理博弈论大都是以数学语言和公理性的方法来进行研究,包含着复杂高深的技术(数学)分析,所以不可避免地陷入到理论推演的结论严重偏离现实的困境。而一直被视为非主流经济学家的托马斯·谢林则一反常态,他采用与主流的数理博弈理论截然不同的研究方法,将该理论非常熟练而又令人信服地运用到政治学、社会学、心理学及国际关系等不同领域之中,从而形成了社会科学的经典理论。可以说,谢林是在放弃传统经济学的抽象假设和理性概念、关注现实中人的行为的基础上创立非数理博弈理论的。 在谢林看来,在双方或多方相互影响的情形下,博弈是不可能通过建立模型来表述进而加以研究的。因为决策主体的期望和行为无法通过纯粹的逻辑和数学推导而得到。每个参与人的行为取决于他是如何预期其他人将如何应对他的行为;并且其他人对该人将如何应对他们行为的预期也同样地影响到其他人的行为。也就是说,人们之间的相互影响及个人的自我控制程度会影响双方的要价及决策分析能力。基于这样更接近现实的观察,谢林开创了非数学博弈理论这一新的领域。他运用优美的语言和小模型,而非严格的逻辑论证,将他的理论通过众多的实际应用分析表述出来。正因为如此,谢林称奥曼是“真正的博弈论专家”,而把自己仅仅看做是博弈论的“使用者”。 在20世纪50年代后期核武器军备竞赛的背景下,1960年,谢林发表了其经典著作《冲突的战略》。在这本书中,他将博弈论作为统一的分析框架应用于社会科学问题,并对讨价还价和冲突管理理论作了非常细致的分析。谢林指出,在效率曲线上,博弈当事人的利益是对立的,任何一个人效用的增加都会损害另外一个人的利益。但这种所谓的对立只是一种逻辑上的可能性,在效率曲线上必然存在一点,使得博弈当事人的利益是一致的。博弈者都希望避免两败俱伤,这种“双赢”的共同想法就体现为——在效率曲线上找到一个合适的点来解决彼此之间的冲突。这些已经被事实证明是解决冲突、避免战争的非常中肯的创见。 谢林另外一个有趣的学说是关于“种族隔离”在全世界的流行的解释。他利用“有界邻里关系模型”,使用一个叫“微观的小冲击放大为宏观的大问题”的词语,分析了非组织的个人动机是如何转变为集体行为的,并以此说明了种族隔离是个人选择的自然结果。他认为这是一个非常简单的理论故事:在一小群少数族裔的人中,他们具有一种“同种族相互取暖”的癖好,不乐意让自己的邻居是另外一些种族的人。于是他们选择搬家,让自己的邻居同自己的肤色和口音一样。如果白人和黑人都不希望成为“少数人”,那么只有完全隔离才是唯一稳定的均衡点。海外的华人大都很难融入当地的主流社会中,早期的唐人街文化一直影响着新移民的心态,就可以用谢林的这一理论来解释。 谢林还发现,在日常生活中,人们喜欢自我欺骗以使自己做应该做的事情,或者避免去做一些不该做的事情。这种抑制自己的偏好,对自己的行为施加控制的现象,被他称为预期的自我控制。谢林认为,人们在不同的偏好之中,理性地选择一些偏好而抑制另一些偏好的现象,在人们的决策过程中是不可忽略的,因此不能将其从消费者行为理论中剔除。如果我们认为消费者在所有时间,即使是短期都具有一致的价值取向和偏好,那么我们会忽略许多重要的下意识的行为。自我控制理论的提出,表明谢林从关注多个参与者之间的博弈转向“自我博弈”,即“以自己为对手”的博弈。谢林试图通过这一理论来回答什么是理性、人是如何控制自己行为的。谢林观察到,人们事实上作了许多本来并不愿意做的事情,比如酗酒、吸烟、缺乏锻炼、低储蓄等。 运用非数理博弈理论,谢林还分析了有组织的犯罪形成的原因。其结论是,法律对犯罪行为的打击力度与犯罪是否有组织密切相关。当法律的打击力度达到某一点时,组织犯罪就会盛行。低于这一点,组织犯罪就无利可图。 此外,谢林还运用非数理博弈理论考察了全球变暖的问题。他认为,解决全球变暖实际上是一个议价问题:如果全世界能够减少二氧化碳的排放,贫穷国家将获得大部分收益,而富裕国家将承担大部分成本。所以,发达国家没有限制二氧化碳排放的动机,而发展中国家又承担不起治理温室效应的成本。于是出现所有国家都会毫无节制地排放二氧化碳的局面。 总之,在过去的20多年里,博弈论取得了很大的发展,尤其是在经济学中越来越占有重要的地位,所有这些都是与奥曼和谢林的贡献分不开的。 相关专题:《人物》杂志 |