第6页 | 策略思维 | xjpvictor的电子书库

第4章走出囚徒困境

20世纪70年代，石油输出国组织（欧佩克）一直合谋提高原油价格，从1973年的每桶不足3美元提高到1980年的每桶超过30美元。每逢欧佩克召集定价会议，整个世界都会焦急不安地等待消息。20世纪70年代后期，一些能源专家已经预测，这么下去，等到20世纪末，石油价格将会涨到每桶超过100美元。不料，突然之间，这个卡特尔组织似乎就要崩溃了。石油价格开始下滑，1986年年初一度下跌至每桶10美元，1987年才逐步回升到每桶18美元。① 就在我们撰写本书的时候，伊拉克人侵科威特，油价又迅速上升到每桶35美元。专家们对欧佩克的前途莫衷一是。

① 当然，我们必须同时记住一件事，即在1981-1985 年，美元对其他货币强劲升值。因此，不管是油价在20世纪80年代上半叶下跌，或者是之后收复失地，油价的变化用美元以外的其他货币结算，都不如用美元结算时看起来那么富有戏剧性。

究竟是什么因素主宰了这样一个卡特尔的成败？而在多数情况下，又是什么因素左右了从商界、政界乃至其他社会机构的合作与竞争之间的平衡？借助我们在第1章提到的发生在克格勃牢房的囚徒困境，这个问题至少可以部分得到解决。

欧佩克的故事就是这么一个博弈。当然，我们讲述的时候采用了戏剧化的叙事方式，强调了个中困境，抛开了许多历史细节。现在，我们从考察仅仅两个成员的产量决策开始，假设这两个国家是伊朗和伊拉克。为以后讲解方便，我们只允许每个国家各有两个产量水平可以选择，分别是每天200万桶原油或者400万桶原油。根据这两个国家的不同决策，输出到全球市场的总量将是每天400万桶、600万桶或者800万桶原油。与这组数字对应，假设价格分别是每桶25美元、15美元和10美元。在伊朗，原油提炼成本是每桶2美元，而在伊拉克则是每桶4美元。于是，我们可以用“百万美元/天”为单位，在图4-1上显示两个竞争对手的利润。每个格子的右上方是伊拉克每天可得的利润，左下方是伊朗的利润。①

图4-l 伊朗和伊拉克的利润图

① 这种用同一个矩阵表示两个参与者的得失的做法来自托马斯·谢林。他用过分谦逊的笔触写道：“假如真有人问我有没有对博弈论做出一点贡献，我会回答有的。若问是什么，我会说我发明了用一个矩阵反映双方得失的做法…… 我不认为这个发明可以申请专利，所以我免费奉送，不过，除了我的学生，几乎没有人愿意利用这个便利。现在，我愿提供给各位免费使用。”

每个国家都有一个优势策略，即选择较高的产量水平进行生产。比如说，伊朗第四行对应产量的利润数字分别是52和32，全都高于第二行对应的数字46和26。假如两国全都选择各自的优势策略，它们的利润将分别达到每天3200万美元和2400万美元。这当然不是一个小数目，不过，假如它们合作，本来可以分别得到4600 万美元和4200 万美元。

这种情况称为“囚徒困境”。其显著特征在于，双方选择各自的优势策略，以使其收益达到最大，不过，与双方选择将其收益最小化的策略相比，最终的收益却更糟。那样的话，双方为什么不选择最小化的策略呢？回到伊朗和伊拉克的例子上来。即使伊朗愿意选择最小化的策略，每天生产200万桶，但伊拉克仍然有生产400万桶的动机，这么一来，结果就是对伊拉克最有利，而对伊朗最不利。假如伊朗不想合作，坚持生产400万桶，这时，伊拉克若是只生产200万桶，伊拉克就是傻瓜，白白牺牲自己的利润。这个卡特尔的问题在于，怎样才能在双方都面临诱惑、很想欺骗对方、从对方所失中获利的前提下，找到一个方法，维持一个低产量、高价格的策略，而这一策略能为双方都带来最高收益。

伊朗和伊拉克的情况与前面提到的克格勃的两个囚犯情况相仿。两个人都知道坦白才是优势策略：假如一方不坦白，另一方就会由于坦白而得到好处；假如一方坦白，另一方若不坦白就是傻瓜了。因此，无论一方怎么做，另一方还是想坦白。这一点对双方都适用。但一旦双方都坦白，各人都会遭到严厉的惩罚。我们再一次看到，谋求个人利益的私心最终导致了一个糟糕的结果。实际上，假如双方都不坦白，双方的结局都会更好一些。问题是，在双方暗自较劲希望为自己谋求一个更好的结果的时候，怎样才能达成这样的合作。

一个产业的几个竞争企业之间也会出现同样的问题。这个间题不仅让商人们苦恼不堪，也同样折磨着商学院的学生们。得克萨斯州A&M大学一位教授让自己班上的27名学生进行一个博弈，而这个博弈会把他们引人囚徒困境。[1]假设每一个学生都拥有一家企业，现在他必须决定自己应该生产1来帮助维持较高价格，还是生产2来通过别人所失换取自己所得。根据愿意选择1的学生总数，将收入按照表4-1 的方式分配给每个学生。

换用图4-2 ，我们可以看得更加清楚，效果也更加明显。

这是一个“事先设计好”的博弈，目的是确保每个选择2的学生总”比选择1的学生多得50美分，不过，选择2的人越多，他们的总收益

就会越少。假设全体27 名学生一开始都打算选择1，那么他们各得1.08 美元。假设有一个人打算偷偷改变决定，选择2，那么，选择1的学生就有26名，各得1.04 美元（比原来少了4美分），但那个改变主意的学生就能得到1.54 美元（比原来多了46美分）。实际上，不管最初选择1的学生总数是多少，结果都是一样，选择2是一个优势策略。每一个改选2的学生都会多得46美分，同时会使他的26个同学分别少得4美分，结果全班收人会少得58美分。等到全体学生一致选择自私的策略，尽可能使自己的收益达到最大，他们将各得50美分。反过来，假如他们联合起来，协同行动，不惜将个人的收益减到最小，他们将各得1.08 美元。你会怎么抉择？

表4-1

图4-2

演练这个博弈的时候，起初不允许集体讨论，后来允许一点讨论，以便达成“合谋”，结果愿意合作而选择1 的学生总数从3到14不等。在最后的一次带有协议的博弈里，选择1的学生总数是4，全体学生的总收益是15.82 美元，比全体学生成功合作可以得到的收益少了13.34 美元。“我这辈子再也不会相信任何人了。”领导合谋的学生这样嘟囔。那么，他自己又是怎么选择的呢？“噢，我选了2。”他答道。

这个情景使我们回想起尤塞里安（Yossarian在约瑟夫·海勒( Joseph Heller）的小说《第22 条军规》（Catch-22）当中的境遇。第二次世界大战胜利在望，尤塞里安不想成为胜利前夕最后一批牺牲者。他的上级军官问：“可是，假如我方士兵都这么想呢？”尤塞里安答道：“那我若是有别的想法岂不就成了一个大傻瓜？"

政治家们也会变成同样的困境中的囚徒。1984年，大多数人都很明白，美国联邦预算赤字实在太高了。裁减必要的巨额开支在政治上并不可行，因此，大幅增税应该是不可避免的。不过，谁愿意担当政治领导角色，带头主张这么做呢？民主党总统候选人沃尔特·蒙代尔( Walter Mondale）想要在自己的竞选活动当中为这么一个政策转变制造声势，却被罗纳德·里根（Ronald Reagan）打得落花流水，因为里根许诺绝不加税。1985年，这个议题陷人僵局，无论你怎么划分政治派别，民主党对共和党，众议院对参议院，还是政府对国会，各方都希望把提出加税的主动权推给对方。

从各方的角度看，最好的结果在于，对方有人提出加税和削减开支，并因此不得不付出政治代价。反过来，假如自己提出这样的政策，而对方坚守被动局面，并不附和，自己就会落得最糟糕的下场。双方都知道，联合起来共同倡议加税和削减开支，共同分享荣誉，分担谴责，与同时坚守被动，眼看巨额赤字上升而无所作为相比，显然会对整个国家更有利，即便对他们自己的政治生涯，从长期而言也会有好处。

我们可以画出一张常见的图（如图4-3所示），标明策略和结果，将这个情况变成一个博弈。双方分别是民主党和共和党。为了表示谁更加倾向于怎么做，我们把每个结果按照各方的眼光给出从1到4的排序，数字越低对自己越好。每个格子左下角是共和党给出的排序，右上角是民主党给出的排序。

显而易见，对每一方而言，保持被动是一个优势策略。而这正是真实发生的情况；第99届国会根本没有做出任何加税决定。此届国会确实通过了《格拉姆-拉德曼-霍林斯法》（Gralmm-Rudman-Hollings Act），这一法案规定以后必须实行削减赤字政策。不过，这只是一种伪装，好像采取了行动，实际却推迟了作出艰巨抉择的时间。这一目的与其说是通过限制财政支出的做法达成的，不如说是通过玩弄会计上的小把戏而实现的。

图4-3 共和党和民主党的排序

1 ．如何达成合作

一旦陷入囚徒困境，人们就会想方设法逃脱，寻求大家一致愿意看到的合作的结果。圈外人则大约更愿意看到他们困在中间无法脱身。举个例子：某个产业的企业由于陷入囚徒困境而不能合谋抬高价格，买方得以从较低价格中受益。在这个例子中，社会希望阻挠这个产业合谋，不让其破解囚徒困境，反垄断法就是其中一道路障。但是，不管我们愿意寻求合谋或者是阻挠合谋，我们都必须了解有什么途径可以破解囚徒困境。只有这样，我们才能找出合适的对策，要么沿着这条路走下去，要么在上面设置路障。

一个根本的难题在于在任何协定下参与者都有作弊的动机。因此，中心问题是，怎样才能觉察这么一种作弊行为？什么样的惩罚才能阻止这种行为？现在我们逐一分析。

2 ．觉察作弊

卡特尔作为一种企业联合组织，必须找出有效的办法，了解是不是出现了作弊行为，以及若是有作弊行为的话，确定是谁作弊。在我们已经讲过的例子中，觉察有人作弊通常都不是什么难事。比如在伊朗和伊拉克石油生产的例子中，石油价格只有在两国合作，每天生产200万桶原油的时候才会达到25美元一桶；只要价格低于每桶25美元，肯定有人作弊。在现实生活当中，情况更加复杂。价格下降可能有两个原因，一是需求下降，二是生产者之一作弊。除非一个卡特尔有本事区分这两种影响，确定价格下降的真实原因，不然的话，它就会在根本没人作弊的时候误以为有人作弊，并且采取惩罚措施，或者是反过来，有人作弊却没觉察。① 这些做法会降低准确性，使有关防范措施的效果大打折扣。一个妥协的解决方案是设置一个关键价格，或者称为“触发”（trigger）价格，一旦价格落到这个价格之下，卡特尔就可认定有人作弊，随即采取惩罚措施。

① 统计文献将错误的肯定称为一类错误，而将错误的否定称为二类错误。最常见的错误却是三类错误：记不起来确切的是哪个。

不过，在现实生活当中还有一个复杂因素。这类博弈通常都有很多不同层面的抉择，觉察作弊的可能性在不同层面也有所不同。比如，企业之间会在价格、产品质量、售后服务以及其他许多方面进行竞争。价格相对而言算是比较容易观察的，虽然可能存在的秘而不宣的折扣或者定价策略的灵活性会使问题复杂化。而在产品质量方面，质量具有许多不同层面，很不好把握。因此，旨在合谋维持较高价格的卡特尔经常发现，企业不断地将竞争引向新的层面。这样的事情就发生在民航产业。在受到政府监管的时期，机票价格是固定的，新竞争者进入的通道实际上被堵死了。这就相当于航空公司在民航管理局的推动下结成卡特尔。但在卡特尔内部，航空公司之间却开始竞争，或者说是作弊。它们虽然不能降低机票价格，却可以提供更加超值的服务，比如可口的飞机餐和美丽的空中小姐。假如劳工法要求航空公司也要聘用男性乘务员，而且不能因为空中小姐超过30岁就解雇，竞争则可以转向其他层面，比如提供更多直飞航线、加大座位宽度以及增加座位前面伸展腿脚的空间。

这种发展趋势还有一个例子，出现在国际贸易政策领域。关税是最容易看出来的、用于限制贸易的工具，关贸总协定（GATT）通过连续多个回合的谈判，最终促使所有发达国家一起大幅下调关税。不过，各国仍然面临国内强大的特殊利益集团的政治压力，它们要求限制进口。因此，各国渐渐转向利用其他一些不那么容易看出来的手段，比如自愿限制协定、海关估价手续、标准、行政手段以及复杂的配额制度。①

① 比如，按照复合纤维协议确定的配额，其征税标准极其复杂，不同织物在不同国家就有不同做法。这套标准使人难以看出配额制度对提高任何一种特定商品的价格究竟有什么影响。尽管如此，有些经济学家仍然估算出了这种影响，而且发现价格可能提高100％的幅度——若是关税高到这个程度，恐怕就要引发广大消费者的强烈抗议了。

这些例子说明了一个共同主题，即合谋集中在比较透明的抉择层面，竟争则转向不那么容易看出来的层面，我们把这个现象称为“提高不透明度定律”。也许读者未必看得出来，但合谋仍然可能损害你的利益。比如，1981年开始实施日本汽车进口配额制度后，不仅包括日本车和美国车在内的全部汽车涨价了，而且大众化的日本车型也从市场上消失了。不透明的竞争后果更甚：不仅导致价格上升，产品组合的平衡也被扭曲了。

确认作弊者可能比觉察作弊更为艰巨。假如只有两个参与者，诚实的一方当然知道谁在作弊。即便如此，能不能让他承认错误可能又是一个未知数。假如出现不止两个参与者，我们可能知道有人作弊，却没人知道究竟是谁，只有作弊者自己心知肚明。遇到这种情况，用于惩罚作弊的手段必然显得莽撞生硬，它会同时影响到无辜者和作弊者。

最后一点，作弊行为可能表现为维持被动，拒绝出头，因此也就更难区分出来。我们前面讲过的不肯带头倡议加税的例子就属于这个情况。遇到这种情况，想要推测或者断定有没有作弊更是难上加难。一方面，积极的行动人人都看得见，另一方面，不作为的借口也有很多，比如还有更加亟须处理的事情，需要时间动员全部力量，诸如此类。

3 ．对作弊者的惩罚

在每一个鼓励合作的良好计划里，通常都会包含某种惩罚作弊者的机制。一个坦白且供出合作伙伴的囚徒可能遭到这些人的朋友的报复。若是知道外面会有什么报应等着自己，尽快逃脱牢狱之灾的前景大概也就不会显得那么诱人了。人人都知道，警察会威胁毒品贩子说要释放他们以让其坦白。这种威胁的作用在于，一旦他们被释放，卖毒品给他们的人就会认定他们一定是招供了。

而在得克萨斯州A&M 大学教室进行的实验里，假如学生们觉察到究竟是谁拒绝按照合谋选择1，他们可能就会整个学期不再理会这个家伙。估计没有哪个学生愿意为了50美分而冒被抵制的风险。至于欧佩克的例子，由于20世纪70年代阿拉伯国家存在社会与政治合作，任何一个打算作弊的国家都担心有可能遭到抵制，因而最终放弃了作弊的想法。这些例子反映了在最初博弈之上增加惩罚机制的做法，其目的就是为了减少作弊的动机。

在博弈的结构里还存在其他类型的惩罚。一般而言，这种情况发生的原因在于这个博弈反复进行，这一回合作弊所得将导致其他回合所失。我们还是用伊朗和伊拉克之间的原油例子进行分析。

由于两个国家天天都在进行这个博弈，惩罚的可能性也就出现了。假设他们从相互信任的基础起步，各国每天生产200万桶，携手维持较高的价格。然而各国都会不断受到诱惑，很想偷偷作弊一把。回到每天的利润图上来。假如这天伊朗作弊且取得成功，伊拉克保持诚实，那么伊朗这天的利润将从原来的4600 万美元上升到5200 万美元，净增600万美元（如图4-4 所示）。

图4-4伊朗和伊拉克的利润图

问题在于，假如伊拉克发现出了事又会怎么样。一个似是而非的情景是，彼此之间的信任瓦解，双方从此进人高产量、低价格的结局。与彼此信任的时候相比，这使伊朗每天少得1400万美元（从4600万美元减少到3200万美元）。可见，作弊带来的短期好处根本无法弥补之后带来的损失：假设伊拉克需要1个月的时间才能觉察伊朗作弊，并且断然决定解除合作，那么，伊朗由于作弊一个月而多得的1.8亿美元，在两国合作破裂13天之后就会被损失抵消。当然，时间就是金钱，今天增加的利润会比明天失去的同样数目的利润更值钱，不过，上述计算看起来仍然很不利。对伊拉克来说，卡特尔破裂将会带来更糟糕的下场：假如它作弊而未被觉察，也没有受到惩罚，那么每天可以多得利润200万美元；假如合作破裂，则每天损失将达1800万美元。显然，在这个例子中，哪怕只有一点点担心两国的相互信任会破裂，也足以约束两个竞争者乖乖遵守协定。

信任破裂有很多原因。比如，若是伊朗和伊拉克开战，欧佩克就很难强迫这两个国家遵守产量配额。有能力对违反协定者进行惩罚是维持卡特尔配额的信任的基础。不过，对于两个已经在用炸弹和“人浪”攻势相互惩罚的国家，你还有什么样的惩罚手段可用呢？一旦战争停止，由于出现了受到惩罚的可能性，合作的可能性也会再度浮现。

归纳起来，在一个一次性的博弈当中没有办法达成互惠合作。只有在一种持续的关系中才能够体现惩罚的力度，并因此成为督促合作的木棒。合作破裂自然就会付出代价，这一代价会以日后利润损失的形式出现。假如这个代价足够大，作弊就会受阻，合作就会继续。上述基本原则包含一些警示。第一个警示出现在合作关系存在某种自然而然的终点的时候，比如一个当选政府的任期到期就会结束。这种情况下，博弈反复进行的次数是一定的。运用向前展望、倒后推理的原则，我们可以看到，一旦再也没有时间可以进行惩罚，合作就会告终。但是，谁也不愿意落在后面，在别人作弊的时候继续合作。假如真的有人仍然保持合作，最后他就会脱不了身。既然没人想当傻瓜，合作也就无从开始。实际上，无论一个博弈将会持续多长时间，只要大家知道终点在哪里，结果就一定是这样。

现在我们进一步考察这个论点。从一开始，两位参与者就应该向前展望，预计最后一步会是什么。在这最后一步，再也没有什么“以后”需要考虑，优势策略就是作弊。这最后一步的结果是一个不可避免的结论。既然没有办法影响这个博弈的最后一步，那么，在考虑对策的时候，倒数第二步实际上就会成为最后一步。

而在这一步，作弊再次成为优势策略。理由是，位于倒数第二的这一步对最后阶段的策略选择毫无影响。因此，倒数第二步可以视为孤立阶段，单独进行考虑。对于任何孤立阶段，作弊都是一种优势策略。

现在，最后两个阶段的情形已经确定。早期进行合作根本无济于事，因为两个参与者已经决心在最后两个阶段作弊。这么一来，在考虑对策的时候，倒数第三步实际上就会成为最后一步。遵循同样的推理，作弊仍是一种优势策略。这一论证一路倒推回去，不难发现，从一开始就不存在什么合作了。

这一论证的逻辑无懈可击，不过，在现实世界里我们仍然可以找到阶段性的成功合作。有几个方法可以解释这一现象。一是，不错，这个类型的所有真实博弈只会反复进行有限次，但具体数目却没人知道。既然不存在一个确定的结束时间，那么这种合作关系就永远有机会继续下去。同时，参与者会有某种动机维持这种合作，为的是万一将来遇到不测，需要别人帮忙；假如这个动机足够强烈，合作就可以维持下去。

二是，这个世界存在一些“善良的”人，不管作弊可能带来什么样的物质利益，他们仍然愿意合作。现在让我们假设你没有那么善良，看看会出现什么情况。假如你按照自己的私心行事，那么在一个反复进行有限次的囚徒困境博弈里，你会从一开始就作弊。而这会使其他参与者看清楚你的本质。于是，为了掩盖真相，或者是至少掩盖一会儿真相，你不得不装出善良的样子。为什么你会那么做呢？假设你一开始就按照善良人的方式行事，其他参与者就会认为你大约属于周围少有的几个善良人之一。合作一段时间将会带来实实在在的好处，而且其他参与者也会打算仿效你的善良人的做法，换取这些好处。这对你也有好处。当然，你和其他参与者一样，仍然打算在博弈接近尾声的时候偷偷作弊。但你们仍然会在最初一个阶段进行互利互惠的合作。因此，在各人假装善良等待占别人便宜的时机的当口，大家都会从这种共同欺骗中得到好处。

三是，能在一个反复进行的囚徒困境中使信任出现的条件是，作弊所得早于合作破裂产生的代价之前出现。这么一来，两者相比哪一个更重要，就取决于现在与将来相比哪一个更重要。在商界，比较现在与将来的利润的时候，会用一个合适的利率对将来的利润打折扣。而在政界，现在与将来的重要性比较更加带有主观色彩，不过，一般而言，下

一次竞选之后的时间看起来无关大局。这使合作变得难以达成。即便是在商界，若是遇到不景气的年份，整个产业处于崩溃边缘，管理层觉得已经走到山穷水尽，没有明天了，那么，竞争就有可能变得比正常年份更加激烈。同样地，由于战争迫在眉睫，伊朗和伊拉克会认为现在的利润会比将来的利润更重要，由此加深了欧佩克面临的困境。

4 ．惩罚的保证

最巧妙的方式在于通过一个保证加以惩罚的承诺推行一个价格联盟，而且是以竞争的名义进行。现在我们将要看到的是纽约市及其立体声音响商店大战。疯狂埃迪（Crazy Eddie）已经打出了自己的口号：“我们不能积压产品。我们不会积压产品。我们的价格是最低的——保证如此！我们的价格是疯狂的。”它的主要竞争对手纽瓦克与刘易斯(Newark&Lewis) ，口号却没叫得那么野心勃勃。然而每次购物，你都会得到这个商店的“终生低价保证”。按照这一承诺，假如你在别的地方看到更低的价格，商店会按差价的双倍赔偿给你。

如果您在购物之后发现，在您购买产品的正常使用年限里，本地同一销售区域的其他商店同样型号的商品打出的价格或者实际销售的价格更低（必须附有打印的凭据），我们纽瓦克与刘易斯将很乐意向您（以支票方式）支付100％的差价，外加25％的差价，或者，假如您愿意，我们将赠送面值相当于差价200％的礼品券（包含100％的差价外加相当于100％的差价的礼品券）。

——摘自纽瓦克与刘易斯的“终生低价保证”

不过，尽管这一家的政策听上去很有竞争力，这个非要击败对手不可的承诺却有可能加强一个操纵价格的卡特尔的内部约束。为什么会发生这样的事情呢？

假设一台录像机的批发价是150美元，现在疯狂埃迪和纽瓦克与刘易斯都卖300美元。疯狂埃迪偷偷作弊，减价为275美元。假如没有那个击败对手的承诺，疯狂埃迪完全有可能将一些原本打算在对手那边购物的顾客吸引过来，而这些顾客之所以要去纽瓦克与刘易斯那边购物，原因很多，可能是因为路途较短或者以前曾在那里买过东西。不幸的是，对疯狂埃迪而言，这回减价起了完全相反的效果。因为纽瓦克与刘易斯有那么一条价格保证，人们就想赚便宜，纷纷进来买一台录像机，然后要求赔偿50美元。这么一来，相当于纽瓦克与刘易斯的录像机自动减价为250美元，比疯狂埃迪减得还厉害。不过，当然了，纽瓦克与刘易斯一定不愿意就这么付出50美元。因此，它的对策就是降价至275美元。无论如何，疯狂埃迪的结果都不如原来。那又何必搞鬼作弊呢？价格还是保持在300美元好了。

虽然卡特尔在美国是非法的，疯狂埃迪与纽瓦克与刘易斯却还是结成了这么一个组织。读者可以看到，它们两家结成的这个心照不宣的卡特尔是怎样按照我们前面提过的卡特尔内部强制条件运行的：觉察作弊，并且惩罚作弊者。纽瓦克与刘易斯可以轻易觉察疯狂埃迪作弊。那些跑来说疯狂埃迪打出更低价格而要求赔偿的顾客，其实在毫不知情的情况下，扮演了这个卡特尔的执法侦探。惩罚的形式是价格协定破裂，结果导致利润下降。那则“击败竞争对手”的广告实际上自动而迅速地实施了惩罚。

联邦贸易委员会接过一个著名的反垄断案子，其中就涉及一种类似机制的利用，这种机制看上去会加剧竞争程度，其实却是一个卡特尔的约束机制。E.I．杜邦公司、乙烷基公司（Ethyl）和其他生产抗震汽油添加剂的公司被指控利用了一个“最优惠客户”条款。这个条款规定，这些最优惠客户将享受这些公司向所有客户提供的价格当中的最优惠价格。从表面上看，这些公司是在寻找它们的最优惠客户。不过，让我们深入考察一下。这个条款意味着这些公司不能展开竞争，不能通过提供一个带有选择性的折扣价格，将它的对手的顾客吸引过来，同时只能向它的熟客提供原来的较高价格。它们必须一起降价，而这么做的成本会大很多，因为它们卖出的所有产品的利润都下降了。读者可以看出这个条款对一个卡特尔有什么好处：作弊所得比作弊所失要小，因此卡特尔也更容易维持。

在评估这个“最优惠客户”条款的时候，联邦贸易委员会裁定其存在反竞争效果，禁止这些公司在它们与客户签订的合同里使用这么一个条款。① 假如现在的被告是疯狂埃迪和纽瓦克与刘易斯，你又会怎么判决呢？判断竞争激烈程度的一个标准是涨价幅度。许多所谓“廉价”立体声音响商店在定价的时候，差不多要在各个元件批发价之和的基础上再加100％。虽然很难看出哪一部分涨价是由库存和广告成本导致的，我们却可以发现一个表面上看来证据确凿的案例，说明疯狂埃迪究竟有多疯狂。

① 这一裁决并非没有争议。委员会主席詹姆斯·米勒（James Miller）就不同意。他写道，这个条款“可以证明能够减少买方的搜索成本，使它们能够在众多买家里找到具有最佳价格价值比的顾客”。希望进一步了解这个案例的读者，请参阅“In the matter of Et hyl Corporation et al.” FTC Docket 9128，FTC Decisions, pp.425-686。

5 ．惩罚方式的选择

如果存在几个不同的惩罚手段，可以阻止作弊和维持合作，我们应该怎样抉择呢？有几个标准可供参考。

惩罚手段最重要的特征也许在于简单明确，这样的话，任何一个打算作弊的参与者都能很方便也很精确地算出作弊的后果。举个例子：假如判断是不是有人作弊的方法是，在过去18个月的折扣利润低于同期产业资本平均真实回报率10个百分点，而这个方法对于绝大多数企业而言实在太复杂了，根本算不过来，那么，这就不是一个良好的阻止作弊的约束方式。

接下来应该考虑的是确定性。参与者应该有信心，相信作弊者将受到惩罚，合作将会得到回报。这在欧洲国家寻求推动关贸总协定的时候成了一个主要问题。如果遇到一个国家投诉说另一个国家在贸易协定上作弊，关贸总协定就会启动一个行政程序，且一搞就是几个月，甚至好几年。而在判决过程中，几乎没人会听案件本身的事实陈述，判决通常更受国际政治和外交政策的影响。这样的约束机制显然不可能发挥什么作用。

然后我们会问，惩罚应该有多严厉。大多数人的直觉反应是，惩罚应该“与罪行相抵”。不过，这也许并不足以阻止作弊。阻止作弊最可靠的方式在于使惩罚变得尽可能严厉。既然以惩罚进行威胁可以成功地维持合作，那么，惩罚本身有多严厉就无关紧要了。恐惧使大家不敢作弊，这么一来，实际上就不会出现违规行为，违规将要付出什么代价当然也就无关紧要了。

这一思路的问题在于，它忽略了出错的风险。侦察过程可能出错，如报告说卡特尔内部有人作弊，而真正导致价格下跌的罪魁却是一个完全不受控制的因素，比如需求下跌。假如惩罚尽可能严厉，那么这个错误的代价就会非常高昂。要想减小出错付出的代价，惩罚必须尽可能轻微，刚刚能阻止作弊就够了。最低限度的惩罚可以达到阻止作弊的目的，又不会在不可避免的差错出现时招致任何额外代价。

6 ．以牙还牙

这里列出的一个惩罚机制应该具备的理想条件显得相当高不可攀。不过，密歇根大学的政治学学者罗伯特·阿克塞尔罗德（Robert A xelrod）指出，以牙还牙法则恰好符合这些条件。[2]以牙还牙其实是古老的“以眼还眼”行为法则的一种变形：人家对你怎么做，你也对他们怎么做。① 说得更精确一些，这个策略在开始阶段双方是合作的，以后则模仿对手在前一阶段的行动。

① 在《旧约·出埃及记》（Exodus, 21:22 ）中，我们看见，“人若彼此争斗，伤害有孕的妇人，甚至坠胎，随后却无伤害，那伤害她的总要按妇人的丈夫所要的，照审判官所断的受罚。若有别害，就要以命偿命，以眼还眼，以牙还牙，以手还手，以脚还脚，以烙还烙，以伤还伤，以打还打。”《新约》则提倡更具合作精神的行为。在《新约·马太福音）（Matthew, 5:38）中，我们读到，“你们听见有话说：‘以眼还眼，以牙还牙。’只是我告诉你们，不要与恶人作对。有人打你的右脸，连左脸也转过来由他打。”我们从“以其人之道还治其人之身”转为“你们愿意人怎样待你们，你们也要怎样待人”（《新约·路加福音》，Luke, 6:31）的金科玉律。假如人们当真遵循这一金科玉律，也就不会存在什么囚徒困境了。此外，只要我们看得更深远一些，不难发现，虽然合作可能在某一个特定博弈中降低你的收益，但是以后可能带来的回报却甚至足以使一个自私的人相信，合作应该算是一个理性策略。

阿克塞尔罗德认为，以牙还牙法则体现了任何一个行之有效的策略应该符合的四个原则：清晰、善意、刺激性和宽容性。再也没有什么字眼会比“以牙还牙”更加清晰、更加简单。这一法则不会引发作弊，所以是善意的。它也不会让作弊者逍遥法外，所以能够产生刺激。它还是宽容的，因为它不会长时间怀恨在心，而愿意恢复合作。

阿克塞尔罗德并未仅仅纸上谈兵，而是通过实验证明了以牙还牙法则的威力。他设计了一个二人囚徒困境博弈锦标赛。世界各地的博弈论学者以电脑程序的形式提交他们的策略。这些程序两两结对，反复进行150次囚徒困境博弈。参赛者按照最后总得分排定名次。

冠军是多伦多大学的数学教授阿纳托·拉波波特（Anatol Rapoport）。他的取胜策略就是以牙还牙。阿克塞尔罗德对此感到很惊讶。他又进行了一次锦标赛，这次有更多学者参赛。拉波波特再次提交了以牙还牙策略，并再次夺标。

以牙还牙策略一个非常引人注目的特征在于，它在整个比赛中取得了突出的成绩，虽然它实际上并没有（也不能）在一场正面较量中击败对手。其最好的结果是跟对手打成平局。因此，假如当初阿克塞尔罗德是按照“赢者通吃”的原则打分，以牙还牙策略的得分怎么也不会超过500 ，也不可能取得最后的胜利。

不过，阿克塞尔罗德并没有按照“赢者通吃”的原则给结对比赛的选手打分，只有比赛结束才算数。以牙还牙策略的一大优点在于它总是可以将比赛引向结束。其最坏的结果是遭到一次背叛，也就是说，让对方占了一次便宜，此后双方打成平局。以牙还牙策略之所以能赢得这次锦标赛，是因为它通常都会竭尽全力促成合作，同时避免相互背叛。其他参赛者则要么太轻信别人，一点也不会防范背叛，要么太咄咄逼人，一心要把对方踢出局。

不过，尽管如此，我们仍然认为以牙还牙策略是一个有缺陷的策略。只要有一丁点儿发生误解的可能性，以牙还牙策略的胜利就会土崩瓦解。这个缺陷在人工设计的电脑锦标赛中并不明显，因为此种情况下根本不会出现误解。但是，一旦将以牙还牙策略用于解决现实世界的问题，误解就难以避免，结局就可能是灾难性的。

举个例子：1987年，美国就苏联侦察和窃听美国驻莫斯科大使馆一事做出回应，宣布减少在美国工作的苏联外交官人数。苏联的回应是调走苏联在美国驻莫斯科大使馆的后勤人员，同时对美国外交使团的规模作出更加严格的限制。结果是双方都难以开展各自的外交工作。另一个引发一系列以牙还牙行动的例子出现在1988年，当时加拿大发现前来访问的苏联外交官从事侦察活动，当即宣布缩小苏联外交使团的规模，而苏联则以缩小加拿大在苏联的外交使团的规模作为回报。到了最后，两国关系恶化，此后的外交合作更是难上加难。

以牙还牙策略的问题在于，任何一个错误都会反复出现，犹如回声。一方对另一方的背叛行为进行惩罚，从而引发连锁反应。对手受到惩罚之后，不甘示弱，进行反击。这一反击又招致第二次惩罚。无论什么时候，这一策略都不会只接受惩罚而不作任何反击。以色列由于巴勒斯坦发动袭击而进行惩罚，巴勒斯坦拒绝忍气吞声，而采取报复行动。由此形成一个循环，惩罚与报复就这样自动而永久地持续下去。

哈特菲尔德家族（Hatfields）与麦科伊家族（McCoys)*的长期争斗，又或者是马克· 吐温（Mark Twain）笔下的格兰杰福特家族（Grangerfobrds) 与谢泼德森家族（Shepherdsons）的世代仇恨，给我们提供了另外两个例子，说明以牙还牙的行动是怎样导致两败俱伤的。不和各方一定不愿意停止争斗，除非他们觉得两家已经打平了。但是，就在这样持续不断的寻求打平的过程中，他们实际上是出手越来越重。最后他们甚至会为此送了命。几乎没有可能回到起点，重新谋求解决双方的不和了，因为，争斗一旦开始，就不会按照人们的意志发展。比如，当赫克·芬恩(Huck Finn）试图了解格兰杰福特家族与谢泼德森家族世仇的源头究竟是什么时，他却遇到了鸡生蛋还是蛋生鸡的难题。

“这究竟是为什么呢，巴克？——为了土地么？”

“我估计是的——我不知道。”

“那么，究竟是谁开的枪呢？是格兰杰福特家的人还是谢泼德森家的人？”

“天哪，我怎么会知道呢？那是多久以前的事啊。”

“有没有人知道呢？”

“噢，有的，老爸知道，我估计，还有其他一些老头子，不过现在他们也不晓得当初究竟发生了什么事。”

*哈特菲尔德家族与麦科伊家族是19世纪80年代美国肯塔基州的两大帮派，长期不和，以在肯塔基与西弗吉尼亚交界的山区地带持枪对射而闻名。当局虽然也会出动镇压，还逮捕滋事分子，无奈两大帮派根深蒂固，称霸一方，入狱者总是很快获得释放。如此僵持不下，直到1890年，两家争斗才渐渐平息下来。此事大大破坏了南北战争之后肯塔基州的形象。——译者注

以牙还牙策略缺少的是一个宣布“到此为止”的方法。因此，若将这一策略用于必然包含误解的情形，就会变得很危险。以牙还牙策略实在太容昌被激发起来。当某一作弊行为看上去像是一个错误而非常态举止的时候，你应该保持宽容之心。即便这一作弊是故意的，经过一个漫长的惩罚循环之后，也许到了该叫停并尝试重建合作的时候了。与此同时，你当然也不想太轻易地宽恕对方而被对方占了便宜。那么，你应该怎么取舍呢？

一个常见的评估策略的方法是衡量它有多大本事对付它自己。如果我们从发展的、演进的角度思考，就会发现“最符合情况的策略”是人们的优势策略。结果是，这些策略会经常相互较量。除非一个策略能够压倒自己，否则，任何最初阶段的成功都将转变为自我毁灭。

乍看上去，以牙还牙策略在对付自己的时候做得相当不错。两个以牙还牙者会从合作开始，然后，由于各方反应一致，合作似乎注定可以永久地持续下去。这种策略配对似乎可以彻底避免囚徒困境问题。

不过，若是有可能出现一方误解另一方行动的情况，又会怎么样呢？为了找出答案，我们仍然利用哈特菲尔德家族与麦科伊家族的例

子，因为他们就是用以牙还牙策略处理邻里关系的。起初他们和平相处（记作P) ，如图4-5所示。

图4-5

假设在第四轮，一个哈特菲尔德族人对一个麦科伊族人产生了误会。结果，虽然麦科伊家族真心维护和平，哈特菲尔德家族还是认为他们出现了侵略的举动（记作A) ，如图4-6所示。

图4-6

这么一个小小的误会犹如回声一般反复进行下去。在第五轮，哈特菲尔德家族以为麦科伊家族出现了侵略的举动而以侵略行动回敬，侵略从原来的想像变成现实。现在，两个以牙还牙的家族陷人了交替为前一次遭到报复而报复对方的情况。在第六轮，麦科伊家族为哈特菲尔德家族在第五轮的侵略而进行报复，导致对方在第七轮再次进行报复。如此类推。企图通过扳回一局而打成平手的做法根本行不通。

这一情况持续下去，直到出现第二个误会。此时有两种可能的发展方向。哈特菲尔德家族可能将和平误会为侵略，又或是将侵略误会为和平。① 假如侵略被误会为和平，整个争斗就会停止（至少可以维持到出现下一个误会之前）。

① 同样地，这些误会也可能出现在麦科伊家族一边，其后果也是一样。

假如第二个误会是将和平当做侵略，双方还会继续相互报复。图4-7显示了第九轮的情况。图中惟一一条表示和平的线段被误会为侵略。结果，哈特菲尔德家族在第十一轮以报复予以回应。双方将继续为对方前一次惩罚自己而进行报复，直到下一个误会出现。虽然以牙还牙者可以出手报复，却不能忍受别人的报复。

图4-7

关于以牙还牙策略的运作，我们可以得出什么结论呢？只要有可能出现误会，长期而言，以牙还牙策略会有一半时间合作，一半时间背扳。理由是，一旦出现误会，双方将问题复杂化与澄清误会的可能性一样大。这么一来，以牙还牙策略其实就跟扔硬币决定合作还是背叛的策略差不多，因为后者选择合作和背叛的几率也是相同的。

在这一节的讨论中，我们似乎一直忽略了一个重要因素：出现误会的可能性。但实际上，我们的结论并不取决于这一可能性！不管出现误会的几率怎样微乎其微（即便是小到万亿分之一），长期而言，以牙还牙策略还是会有一半时间合作，一半时间背叛，就跟一个随机策略一样。如果出现误会的几率很小，那么出现麻烦的时间就会推迟。不过，反过来，一旦出现误会，就要花更长时间才能澄清。

存在出现误会的可能性意味着你必须有更宽宏的雅量，但只可记住，而不是简单地采取以牙还牙的报复行动。这在大家认为出现误会的几率很小，比如5％的时候是正确的。不过，假如处于一个有50％的几率出现误会的囚徒困境中，你又该怎么做呢？你该有多大的宽宏雅量呢？

一旦出现误会的几率达到50% ，再也没有可能在囚徒困境中达成合作。你应该永远背叛对方。为什么呢？设想两种极端情况。假设你永远选择合作，而你的对手有一半时间会误会你的行动，结果是他会认为你一半时间背叛，一半时间合作。假如你永远背叛又会怎样？这种情况下你仍然会有一半时间被误会，只不过这一次对你是有利的，因为对手认为你有一半时间是合作的。

不管你选择什么策略，你都不可能影响你的同伴的看法。这就好比你的同伴是靠扔硬币来决定自己认为你做了什么一样。一旦出现误会的可能性达到50% ，看法与现实将再也没有什么联系。既然你根本没有可能影响你的同伴接下来将要作出的抉择，你大约还是选择背叛的好。你会在每一个阶段得到较高的回报，将来也不会遭到什么损失。

关键在于，保持宽宏雅量直到某一阶段是值得的。假如出现误会的可能性变得太高，那么在囚徒困境里保持合作的可能性就会消失殆尽。合作实在是太容易破裂，以至于不可能加以利用。较高的出现误会的可能性使你根本没有办法通过自己的行动传达清晰的信息。由于缺乏通过行动沟通的能力，合作的希望也就不复存在。

出现误会的可能性达到50％是可能出现的最糟糕的情况。假如大家都知道误会一定会出现，就会把每一个信息理解成相反的意思，那么误会也就不会出现了。一个百发不中的股市预言者其实跟一个百发百中的股市预言者同样出色。只不过你要知道应该怎样解读这些预言罢了。

记住这一点。接下来我们会找一个办法，破解这个其中可能出现误会而出现误会的可能性又不是太高的困境。

7 ．以牙还牙策略的一个替代选择

清晰、善意、刺激性和宽容性等基本性质看起来很可能恰好符合任何能将自己解脱出囚徒困境的行为准则的要求。不过，以牙还牙策略在惩罚一个有过合作历史的人时显得过于急躁了一些。我们必须找出一个更能区别对待的策略：这一策略应在背叛只是偶尔为之时显得宽容一些，而在背叛成为一种惯常行为时又能果断地实施惩罚。

读者可以考虑遵循以下指导原则，作为迈向这一方向的一步。（1) 开始合作。（2）继续合作。（3）计算在你合作的情况下对方看上去背叛了多少次。（4）假如这个百分比变得令人难以接受，转向以牙还牙策略。注意，与以前不同，此时的以牙还牙策略不是作为对良好行为的奖赏，相反，却是对企图占你便宜的另一方的惩罚。

要想确定令人难以接受的背叛的百分比是多少，你必须了解对方行为的短期、中期和长期历史。仅看长期历史是不够的。一个人合作了很本长时间并不意味着他不会在声誉开始下降的时候企图占你的便宜。你还要知道“最近你都对我做过什么”。

这里有这一策略的一个例子，更具善意，更宽容，又没有那么大的刺激性，比以牙还牙策略复杂一点。从合作开始，如此继续下去，直到情况符合下面4个检验中的1个。

·第1印象：第一轮就背叛绝对不可接受。转向以牙还牙策略。

·短期：任何3轮当中出现2次背叛也是不可接受的。转向以牙还牙策略。

·中期：过去20轮当中出现3次背叛也是不可接受的，转向以牙还牙策略。

·长期：过去100轮当中出现5次背叛也是不可接受的，转向以牙还牙策略。

用以牙还牙策略惩罚不必永远持续下去。记录对方符合上述4个测试的频率。出现第一次背叛之后，进行20轮如回声一般的以牙还牙的相互报复，然后改为合作。同时将对方置于观察期，严密监视。另将中期和长期测试当中可能允许出现的背叛次数减1。假如对方在观察期内的背叛次数没有达到这一数字的50% ，就可以将他的背叛记录清为零，重新开始计算。假如对方在观察期内犯规，那就采取以牙还牙策略，永不改变。

对于第一印象以及短期、中期和长期印象，其确切规则取决于错误或误会发生的几率、你对未来获益和目前损失的重要性的看法，等等。不过，在并不完美的现实世界里，这种策略很可能胜过以牙还牙策略。

必须记住的一个重要原则是，假如有可能出现误会，你不要对你看见的每一次背叛都进行惩罚。你必须猜测一下是不是出现了误会，不管这个误会来自你还是你的对手。这种额外的宽容固然可使别人对你稍加作弊，不过，假如他们真的作弊，他们的善意也就不会再有人相信了。最终误会出现时，你再也不会听之任之。所以，如果你的对手有投机倾向，他终将自食其果。

8 ．案例分析之四：国会对联邦储备局

美国国会和联邦储备局经常在经济政策上发生冲突。为了解释这一争端是如何引发以及将会导致什么结果，我们在这里介绍一下普林斯顿大学经济学家艾伦·布林德（Alan Blinder）对这一争端所做的博弈论分析。[3]这两个机构各自拥有相当独立的制定经济政策的权力。制定财政政策（税收和政府支出）是国会的工作，而制定货币政策（货币供给和利率）则属联邦储备局负责。各方可以选择用扩张或紧缩的模式实施自己的政策。扩张的财政政策意味着高支出和低税收，这会降低失业率，却有引发通货膨胀的风险。扩张的货币政策意味着低利率及由此形成的更宽松的借贷条件，这同样有可能引发通货膨胀。

对于经济结果，这两个机构也有各自的好恶标准。选民喜欢政府支出给他们带来的好处，比如降低按揭，却不愿意交税。有鉴于此，国会倾向于采取扩张性的政策，除非通货膨胀已经迫在眉睫，而且非常严重。相反，联邦储备局看得更长远，认为通货膨胀才是更关键的问题，因此倾向于采取紧缩性的货币政策，即紧缩银根。

1981-1982年，国会一度不再把通货膨胀当做一个多么了不起的风险。他们觉得整个经济有能力承受一个扩张性的财政政策，想要联邦储备局加以配合，同时采取一个扩张性的货币政策。不过，保罗·沃尔克（Paul Volcker）领导的联邦储备局担心这么做只会重新引发通货膨胀。在联邦储备局看来，第一选择是财政政策和货币政策同时紧缩。换言之，国会认为最理想的政策在联邦储备局看来糟糕透顶，反之亦然。

国会与联邦储备局的利益却并非完全对立。为了达成妥协，双方就一个采取扩张政策，另一个采取紧缩政策的相对优点进行了辩论。不管谁采取扩张政策，谁采取紧缩政策，这一混合策略对一般就业和通货膨胀的影响都相差不大，区别在于其他重要方面。扩张的财政政策和紧缩的货币政策会产生庞大的预算赤字，同时会拉高利率，因为只有这样做才能募集必要的资金，以在货币政策紧缩的前提下支持这个赤字的财政政策的运行。高利率还会对一些重要的行业，比如汽车和建筑业，造成非常严重的伤害。而外国资本由于受到美国高利率的吸引，也会蜂拥而入。美元将会升值，美国的国际竞争力将因此受到削弱。

财政紧缩政策和货币扩张政策会导致相反的结果：利率降低，美元贬值，对我们的汽车和建筑行业大有好处，也使我们销售的产品更具竞争力。国会和联邦储备局在这两种选择面前一致倾向于采取后面这个混合政策。

这种情况下，你预计可能出现什么结果？你会怎样判断这个结果？而你又会觉得整个政策制定过程应当进行什么改革呢？

案例讨论

这是一个囚徒困境。不然的话，这个案例也不会出现在这一章了，不是吗？）让国会和联邦储备局对4种可能的政策混合模式排列名次，1表示最佳，4表示最差。于是我们可以得到图4-8。

图4-8 联储和国会对结果的排序

对于国会，高支出是一个优势策略；对于联邦储备局，优势策略是收紧银根。一旦双方这么想，而且各自选择自己倾向的策略，结果将是财政赤字和银根紧缩。这正是20世纪80年代初发生的事情。不过，其实还存在一个对双方都更加有利的结果，即预算盈余和银根放松。

究竟是什么使它们没能达成一个对彼此都更加有利的选择呢？答案又是决策的相互依存性。只有在双方一致选择单独看来不那么好的策略的时候，才会取得对于双方都更好的结果。国会必须限制支出，从而达到一个平衡的预算。不过，假如国会这样做了，谁能保证联邦储备局就不会报以一个收紧银根的政策呢？若是联邦储备局当真那么做，就会出现在国会看来最糟糕透顶的结果。国会不相信联邦储备局有能力抵御这样的诱惑。它们没有办法彼此许下值得信赖的承诺，正是这一事实堵死了通向双方都更愿意看到的结果的道路。

我们能不能提出一个走出这一困境的办法呢？双方有着一种持续的关系，合作可能出现在反复进行的博弈当中。不过，合作只有在双方都足够重视未来收益的时候才会出现。国会议员每隔两年就要谋求竞选连任，要他们以如此长远的目光行事，实在困难。

我们不妨从另一个角度审视这个间题。其实，联邦储备局本身就是国会的一项发明。在大多数其他国家，政府（财政部）对中央银行的控制权要大得多。假如美国也是这样，那么，国会完全可以强迫联邦储备局采取一个扩张的货币政策，从而达成国会最想看到的结果。当然，那些赞同联邦储备局的看法，认为通货膨胀才是重要问题的人，会觉得这实在令人感到遗憾。

看上去这是一个没有胜方的情况：协调财政和货币政策等同于国会短视的政治目标取得成功，可惜，由一个独立的联邦储备局开出的支票和结余却引出了一个囚徒困境。也许，一个解决的方案是让联邦储备局决定支出和税收，而让国会确定货币供给？

请支持我们，让我们可以支付服务器费用。
使用微信支付打赏