书摘:赛局理论,或者社会心理学的大肠杆菌

二十多岁时,冯纽曼的名字就已经在全球数学界传开了。年轻的冯纽曼曾轻率地断言人们的数学能力一过二十六岁就会下降,只有靠着经验,才能掩盖这种下降趋势——但也只能掩盖一时而已。不过另一位数学家、他长期的朋友…

二十多岁时,冯纽曼的名字就已经在全球数学界传开了。年轻的冯纽曼曾轻率地断言人们的数学能力一过二十六岁就会下降,只有靠着经验,才能掩盖这种下降趋势——但也只能掩盖一时而已。不过另一位数学家、他长期的朋友乌拉姆指出,随着冯纽曼年纪增长,二十六岁这个关卡就被他提高了。

兰德最初的赛局理论专家小组慢慢解体了。冯纽曼愈来愈忙碌,花在赛局理论的时间愈来愈少。一九五一年,兰德机构把冯纽曼的日薪加倍到一百美元,希望他花更多时间在兰德,但是收效甚微。一九五五年初,冯纽曼终于放弃了和兰德的合作,因为他被任命为原子能委员会委员,不得不缩减外务。

德莱歇是少数留在兰德、直到一九八○年代才退休的人。佛拉德于一九五三年便离开兰德去了哥伦比亚大学,并帮助校方把兰德的同事鲁斯吸收过来;他也在那里开始了完全不同的事业。他担任一位电视制作人的顾问,协助修改一个益智节目的现金支付方式。近年来,他的兴趣包括“投票数学”。他希望探求和推广能更公正表达少数人利益的投票制度。

纳许的妄想症愈来愈严重。他老是古怪地想着要加强兰德的安全措施,用这些念头纠缠同事,最后被送到精神病医院治疗。后来康复以后他加入了普林斯顿的高等研究院。

对赛局理论的批评

人们对赛局理论的看法也发生了变化。《赛局理论与经济行为》出版十年以后,最初的振奋情绪消退了。赛局理论受到非难、怀疑甚至痛斥。

对许多人来说,始终与冯纽曼联系在一起的赛局理论,似乎是用来包装对人类命运的无情嘲讽。有一些例子说明了这种新看法是何等严重。一九五二年,人类学家巴特森在给数学家维纳的一封信中写道:

应用赛局理论的后果是,强化了参与者对规则和竞争前提的接受度,从而使参与者愈来愈难相信或许另有其他方式应对别人……赛局理论的应用号称是带来了各种改变,但我怀疑其长期改变的结果是进入一种病态的方向而令人厌恶。我不仅在思考冯纽曼模型中假设参与者互不信任的前提,也在思考人类本质不变的这个更抽象的前提……冯纽曼的“参与者”不同于人和哺乳动物,他们只是“机器人”,完全没有幽默感,也完全不会“玩”(就像小猫、小狗那样玩)。

赛局理论专家很清楚他们的专业受到玷污的形象。一九五四年,兰德机构的威廉斯写道,赛局理论专家“常常被人类学领域的学生看成早熟的孩子,不懂得人以及人的工作何其复杂,只会瞪大天真无邪的眼睛胡思乱想,希望他们的玩具武器像杀死无生命的玩具龙一样能杀死真的龙。”

再看看兰德的资深研究员鲁斯和莱法在他们一九五七年的书《赛局与决策》中是怎么说的吧:“历史事实告诉我们,许多社会科学家对赛局理论的幻想后来破灭了。最初,他们天真地追逐流行,觉得赛局理论解决了社会学和经济学中的无数问题,或者至少为需要经过几年才能解决的实际问题提供了答案。结果证明情况并非如此。”

一九六○年,兰德机构经济学部门的负责人查尔斯.希契告诉《哈泼》杂志:“就我们的目标而言,赛局理论非常令人失望。”大众很容易把赛局理论当作一种合理化核战的工具。纽尔.戴维斯的《劳伦斯和欧本海默》书中引用欧本海默的话问:“我们怎样才能创造出文明呢?文明总是把道德当作人类生活的基本要素……文明不可能谈论几乎所有人被杀死的前景,除非是深谋远虑的赛局理论用语。”

还有一些人认为许多问题要归咎赛局理论使用者的心态。一九六二年,拉波普特为《美国科学人》杂志写了一篇很有见解的文章〈赛局理论的应用和误用〉:

……赛局理论在那个以最原始、最残忍的方式解释培根名言“知识就是力量”的圈子里已经被接受了。在我们的社会里,决策者们全神贯注于权力冲突:经济的、政治的、军事的冲突。赛局理论是一门“冲突的科学”。这门新科学除了是为那些以最快速度攫取最高权力的人所准备的“权力的蓄水池”,还能是什么呢?但如果你透彻理解了赛局理论,这种贪婪的希望就会消失。

人们对赛局理论的疑虑持续到一九八○年代,甚至到今天。海姆斯在《冯纽曼和维纳:从数学到生与死的技术》书中写道:“赛局理论描绘了这样一个世界,里面有精于算计的聪明人冷酷不懈地追逐自身利益……对人类行为的这种霍布斯式的描绘是如此刺目,因而引起了许多人的反感。但冯纽曼更情愿是错在怀疑和不信任的这一边,而不愿意在对人类和社会本质充满幻想的一边出错。”

对赛局理论的指责分两大类:一类认为赛局理论无非是马基维利式的演算,用来证明战争或不道德行为是正当的;另一类认为赛局理论在现实世界中没什么用处(其纯数学探讨的有效性则未被质疑)。这两种反对意见都值得检验。

效用和马基维利

赛局理论中的参与者都是以“利己主义者”的面孔出现。囚犯困境的故事,包括塔克的故事和本书中其他几种故事,都要求你设身处地把自己当作无视道德的冷酷歹徒,你的对手则同样残忍无情。为什么需要这种冷冰冰的故事?

这并非因为赛局理论是讨论具有某种心理素质的人(自我中心或冷酷无情)如何进行赛局。它讨论的是如何使策略更为有效。赛局理论讲的只是“效用”,与坐几年牢、赚多少钱等此类的事无关。你可以回忆一下前文,所谓“效用”只是一个抽象概念,可以看作参与者的“点数”。由于效用是大家不太熟悉的概念,科学家于是试图在解释赛局理论时,避免解释效用这件事。这是可能的,因为效用跟赚多少钱、坐几年牢或其他有形单位之间存在着简单而明显的对应关系。

对于一个非道德的个人主义者,这种对应确实很简单。钱是好东西—─钱愈多愈好!把人们的效用对应到具体的对象,袪除由背叛造成的道德顾忌以及由行善获得心灵回报等使事情复杂化的因素之后,讨论起来就容易多了。但如果认为赛局理论是专门讨论这样的人,那就错了。

赛局理论和算术一样是一种抽象的工具,可以应用于现实世界,但前提是其严格的要求必须得到满足。比如有一个人要算一下口袋里有多少零钱。她掏出3枚一元和7枚五元的硬币,算出她有38元。后来她发现点错硬币数了,五元硬币只有6枚而不是7枚,因此她只有33元。这意味什么?难道是算术错了吗?当然不是。如果你点错了硬币数,你不能因此怪算术的错。同样的,正确看待“效用”是应用赛局理论的前提。

算术和赛局理论也有不同之处。两个人只要正确点出硬币数目,结果一定相同。但效用则随主观定义而有不同。如果赛局的结果不是现金奖励,而是一些非常复杂的事物,那么任何两个人都可能对一组赛局的结果有不同的偏好排列。

赛局理论是一个万花筒,它只能反映应用者的价值体系。如果从赛局理论得出的结论似乎是马基维利式的,那么通常是因为应用赛局理论的人具有马基维利式的价值体系。

有鞍点的零和赛局和没有鞍点的零和赛局也有严格的区别。即使只有结果的偏好程度排列,零和赛局也存在鞍点。而对于其他类型的赛局,效用必须有一个严格的数值尺度(区间尺度),否则就没有可用来计算出正确的混合策略机率的数据了。

在军事策略这类的实际事物上,你很难有把握指定其结果(和平、局部战争或核武大屠杀)的数值。你可以凭空凑出“合理的”数字来,但这有违赛局理论的应用目的,提供远比直觉更精确的建议。就像拉波普特在《美国科学人》上指出的:

除非对偏好程度能做出十分精确的定量表示,否则就无法在没有鞍点的赛局中做出合理的决策。我常常怀疑,那些被说服接受赛局理论的决策者们是否理解这种不可能性,就像用传统工具无法做出与圆面积相等的正方形一样。我见过许多研究报告,听过许多长长的讨论,说什么冷战和热战都可以当作赛局。假定冷战和热战是零和赛局(其实不是!),那么必须用一个差距尺度对各种结果的“效用”指定数值。这就成了问题。当然我们可以回避它,以为可以用这样或那样的方法指定效用的数值,然后就可以利用赛局了。但这不是十二万分的可笑吗?基于任意假设而得到的结果,又会有什么实际用途呢?

在任何复杂的事物中, 我们都可以预期不同人对可能的结果有不同评价。 某位分析家认为是囚犯困境的赛局, 另一位分析家可能当作有鞍点的零和赛局, 第三位分析家却又视为需要混合策略的赛局。 大家可能得出不同的结论, 却也可能都是正确无误地应用赛局理论!

人是理性的吗?

九成以上的赛局理论的应用目的是预测人的行为,或对人的行为提出建议。但赛局理论并不能有效地预测人的行为。这项失败很难漠视。赛局理论的建议是基于人们“理性”参与的假设;但当对手是非理性时,建议可能就不是最好的了。

这个问题有点像零售商的“诱人上钩再调包”的手法。你到汽车销售商那里去,因为他登了广告,有一款你想要的车,售价一万美元,该车型的最低广告价格。但售货员说车子已经卖完,他们有另一款车,售价一万两千美元。麻烦在于,你不知道这个价格是否为该款车的最好价格,或者,你甚至不知道你是否想要此款车。你到经销商那里去的唯一原因是想得到广告中的那种车;现在他们没有了,怎么办呢?你肯定会犹豫,因为到另一家销售商未必更好。

在赛局理论中,你通常是基于一个可能的结果(小中取大或纳许均衡)而选定某个策略。如果你的对手不是照赛局理论的预测去做,那么你可能发现换一个策略也许更好。

向赛局理论提出挑战的最初实验之一,是兰德机构在一九五二和一九五四年的一系列研究。研究小组中包括纳许,目的是检查冯纽曼的N人赛局理论到底是否可以应用。

在兰德的实验中,四到七个人围坐一桌,模仿冯纽曼理论中的一般N人赛局。受实验者被告知,如果他们能形成联盟就可以获得现金报酬。一个裁判告知每个可能的联盟所会获得的奖励金额,而联盟成员可以用任何看来合理的办法分享奖金。实验结果可谓一团乱,跟《赛局理论与经济行为》中的描写大相迳庭,反倒更像小说《苍蝇王》的情节。兰德报告是这样说的(引自《赛局与决策》):

显然参与者个性上的差异处处可见。一名参与者是否加入联盟,看来跟他是否健谈密切相关。当一个联盟形成以后,经常是由最敢作敢为的成员负责其后的讨价还价。在许多例子里,即使在联盟的首次形成过程中,积极性也扮演重要作用;在裁判发出“开始”命令以后,谁第一个大叫、叫得最响将使结果有所不同。

在四人赛局中,参与者的座位安排似乎对结果没什么影响;但在五人赛局中,尤其是在七人赛局中,这变得十分重要……一般来说,参与者人数增加后,气氛变得更混乱、更激动,竞争更激烈,参与者也觉得更不愉快……

结果到底是证实或否定了冯纽曼与摩根斯坦的理论,极端难以判断。而这有一部分原因或许是他们理论的主张并不是十分清楚。

兰德实验中的激动的受实验者虽没有像冯纽曼和摩根斯坦所分析的那样行动,但这不能反驳他们的数学分析。然而,对于任何可能还需要赛局理论的人来说,此实验还是引人注意,因为赛局理论并不能很有效地预测人的行为。希望赛局理论很快使经济学发生革命的人必然觉得实验结果特别令人失望。经济学理论必须预测有血有肉的人将怎样做,不管其行动是理性的还是非理性的。

我们不需要研究多人赛局就能发现非理性的证据。更令人迷惑的是囚犯困境的实验。就像佛拉德/德莱歇实验,大多数此类实验涉及重复的囚犯困境,也就是一系列的囚犯困境:每个参与者都知道自己将和其他人反覆地互动。

重复的囚犯困境在心理学研究中已经成为流行的题目,政治学家艾瑟罗德特别称之为“社会心理学的大肠杆菌”。拉波普特估计,一九六五至一九七一年间发表的涉及囚犯困境的实验报告达两百个。

书名:《囚犯的两难:赛局理论、数学天才冯纽曼,以及原子弹的谜题》 Prisoner’s Dilemma: John von Neumann, Game Theory, and the Puzzle of the Bomb
作者:William Poundstone
翻译:叶家兴
出版:左岸文化
日期:2019

留下评论

您的电子邮箱地址不会被公开。 必填项已用*标注