2011年01月03日
囚徒困境是经常学中经常提到的一个案例。内容是这样的:警察对两名盗窃罪共犯进行隔离审问,并给出了处罚原则——“双方均不供出对方,则二人均得以释放;只有一方供认对方,则供出方得以释放,而被供出方则被关押10年;双方均供出对,则二人将都被关押5年。”
在这种一次性博弈的理想状况下,就囚徒来讲,最理性的选择应该是选择“供出对方”。因为选择供出对方,无论对方供出自己与否,自己的最大风险只可能是“关押5年”。如果选择不供出对方,那么自己的最大风险则一下被提高到“关押10年”。囚徒困境的处罚原则是警方迫使罪犯做出最有利于警方的选择的一种聪明设定。但在实际中,警方要考虑的问题通常还有困境之外的因素。比如说,罪犯是否会做出最优选择、重复犯罪、罪犯之间的义气、报复心理等。也就是说,实际中的博弈并非是像囚徒困境中的博弈这样的单纯的。
往往现实中的博弈是多次重复的。比如政治上权利斗争的博弈、经商中利益取得的博弈、人情关系发展的博弈等。比如,在政治中,对上级的巴结是促使自己提升职位的一种必要方法。但想必提升自己职位的人并非只是一个人,而是多数人。那么,在多个人的博弈中,是选择巴结还是选择不巴结就成为了一个博弈问题。假设多数人都是必然想必提升自己职位的,则选择巴结是每个人的最优选择。因为选择巴结,最优的效益即是自己的职位得以提升,而最差的效益则是自己没有得到提升。如果不选择巴结,则效益永远是零。
可以见得,在一个权力是对上负责的体制中,腐败现象的产生必然的且是合乎自然人理性的。因此,在权力对上负责的体制中,要想防范腐败的产生,则必须对权利博弈设定一个强制惩罚规则。有了强制惩罚规则,人在博弈中就得考虑因巴结所带来的惩罚风险。这时,最优的选择即变为了不去巴结。当然,前提是因惩罚所要付出的成本要与腐败所获取的利益相当甚至更大。
上面的巴结现象是重复出现的,在重复的权力斗争中,不可能单纯地只存在巴结与不巴结关系。其中还包括报复陷害以及个人能力对权力的影响等因素。由于政治权力关系到民生,因此必须用国家强制力对其博弈行为进行规制。而在生活中,为了给予公民生活行为尽可能多的自由度,强制力的范围应当是有限的。这也就是说,生活中的博弈,多数情况下,人是完全可以按照自己的利益最大化方向去选择行为的。那么,什么样的博弈方式在重复的生活博弈中是最优的呢?
在一次性博弈中,最优的选择当然是如囚徒困境中一样,应该选择背叛。但在多次性博弈中,为了取得最大效益,永远选择背叛是绝对不利于自己的。因为其他人的选择会不自觉地参考你先前的选择。如果你一直选择背叛,其它多数人也注定会选择背叛以降低他们的最大风险。而永远选择合作也是绝对不利于自己的,因为其他人同样会参考你之前的选择而作出背叛从而提高他们的最大收益。最理性的博弈策略,经密西根大学的学者罗伯特爱克斯罗德的实验证明,应该是“一报还一报”(TIT FOR TAR)。也即,博弈策略的初始选择一直选择合作,之后的博弈则一直重复上一次博弈中对方的选择。这一策略反映到生活中,则为我们解释了如下人性特征存在的合理性的问题:
一、善良。博弈的初始选择一直保持合作,永远不在博弈中首先选择背叛,此即善对他人的表现。
二、报复的必然性。善良并非是无原则的进行下去,一旦对方选择背叛自己,报复则是必然发生的,这是一种对对方背叛行为的警示。
三、宽容。报复并非是永久性存在的,当背叛过自己的对方选择悔过合作后,博弈的选择仍然可以是合作。
四、不嫉妒。一报还一报的策略,永远不会嫉妒对方的博弈收益,,因此,这样的博弈行为则是一种非常谦和、与世无争的策略。
五、不占小便宜。通过设计巧妙的策略来在博弈中占他人的便宜,看似非常聪明,实则不然。在巧妙的策略遇上比较“傻”的策略时,巧妙的策略是会占有一些便宜。但一旦遇上“个性顽强”的策略时,便无计可施了
五、简明。一报还一报的博弈选择非常简明,不会因策略的不明确而给博弈对方造成判断上的模糊。因为如果对方因对你的策略产生了不明确后,对方的选择也会变得不明确起来,结果是自己无法明确地依对方的判断而作出选择。因此,在生活博弈中,让对方明了自己的选择以及明确了解对方的选择是非常有必要的。
众所周知,在股市时行心里分析、了解对手的资金操作策略是非常重要的分析手段之一。但问题在于是,这种博弈分析是可以无穷嵌套的,即假定双方永远比对方多考虑一步棋。这样,最后博弈的效果是非常之差的,导致最终的利益获利者往往是游戏的设定者而不是游戏的参与者。有一个有趣的事例为证:两个旅行者在同一地各自购买了同样的花瓶,在飞机运输到站后,花瓶都发生了毁损。两名旅行者当然想让航空公司赔偿尽可能多的钱,可航空公司设定了如下规则——赔偿额上限为100元,实际赔偿额为申请赔偿价最低的人所报的价格,且对最低报价者给予2元的奖励。如果博弈双方选择合作,则双方都应当报价100元。但如果一方有点儿小聪明,则会选择报价99元,因为这样他可以获利2元的奖励。可是另一方完全可能更聪明一点考虑到对方会报价99元,于是另一方报价98元,则另一方会获利100元,不会因对方报价99元而少获得1元。如此往复下去,最后的结果只可能是报价降低为0元,于是航空公司省了一笔赔偿费。
从上面的例子可以看出,无穷嵌套的重复分析,对交易来讲,是没有什么好处的。重复嵌套的分析,只能让自己操作模棱两可,最终甚至还不如一个简单的选择。比如,主力在打算进行洗盘时会分析其它大中小户的心理,想着如何将使他们将筹码卖给自己;嵌套一次,大中小户则会思考主力如何让自己卖调自己手中的筹码,从而进行反相操作;再嵌套一次的话,主力则会在大中小散户对自己的分析上再进行反向操作……于是,最终的操作结果无非是导致行情的上涨或下跌。
既然最终的结果是简明的,不如利用上面所述的“一报还一报”策略进行操作选择。在操作策略上永远要在明确主力行为之后再进行操作,初始操作一定要与主力合作,帮助主力进行拉抬股价,不要在建仓阶段对股价进行打压;永远不要参与方向不明确的操作,因为博弈的对手的选择都不明确的话,你与其博弈是没有胜算可言的,千万不要去贪图那么点回调的利润;当然主力选择背叛时,即主力时行大力打压价格时,你就应当进行报复,不管你的报复力有多强,你都应该抢在他前面将价格砸下去让他无法获取更大利益;一旦主力“悔过自新”决定再次拉抬股价时,你则再次选择合作,同其分享利润。
操作也就是如此简单,这是博弈思想在股市中的一点体现。
关键词:囚徒困境重复博弈