赵汀阳博士 赵汀阳:博弈问题的哲学分析

2017-12-30
字体:
浏览:
文章简介:2002年8月21日纳什在京作了"在非合作博弈中通过代理人而达成合作的研究"的报告,这是纳什尚为完成的一项研究.虽然没有听到本来所期待的结论,但我其实不太相信博

2002年8月21日纳什在京作了“在非合作博弈中通过代理人而达成合作的研究”的报告,这是纳什尚为完成的一项研究。虽然没有听到本来所期待的结论,但我其实不太相信博弈论这样深刻复杂的研究能够获得“最后的”结论。

这种哲学的怀疑论态度或许不太礼貌,尤其今天博弈论已经取得辉煌成就而成为在数学、经济学、生物进化和社会分析等领域里极具影响力的理论。从哲学的角度对博弈问题进行分析可能另有一番意义。哲学属于理想主义式的研究,如与数学进行类比,似可说哲学有些类似纯数学。

我喜欢克莱因说的:“为了激怒纯数学家,应用数学家宣称,纯数学家能发现任何求解中的困难,而应用数学家却能够对任何困难求解”。这话也可以用来“激怒”哲学家。

哲学总是试图“全面地”看问题,试图把各种可能性考虑在内,于是就总是发现“任何求解中的困难”。这种思维虽然苛求,但任何一个事情确与各种可能性复杂地相关——这个事实正是哲学所以必要的理由。我们不得不在深入思考某个问题时去思考所有问题,这就是“一个问题/所有问题”的思维模式。

因此我又喜欢Talleyrand所说的一句看来或多或少有利于哲学的话:“理想主义者无法持久,除非他是个现实主义者,而现实主义者也无法持久,除非他是个理想主义者”。

博弈论的辉煌首先来自纳什1950年以来的创造性成就。这里无需论及博弈论的细节(关于博弈论已有无数文献,在中文文献中也有张维迎和谢识予等的著作),但仍然可以从涉及更多可能性的哲学开放语境中去分析。其实博弈问题(即游戏问题,game)本来也是哲学中最重要的问题之一,维特根斯坦就是哲学博弈论的代表人。

当代哲学中关于政治、社会、伦理、历史等问题的讨论实际就是关于人类博弈的基本条件和问题的研究,甚至在哲学中最纯粹的、过去一向仅仅研究人与知识对象之间的单纯关系的知识论在今天也已经不得不把博弈问题看作是它的一个方面。

福科等在促进知识论这个不纯粹的方面的发展有着重要贡献,他发现知识与权力之间有着密切的互动关系;哈贝马斯等则进一步强调了知识论中的对话/交往问题;萨伊德和亨廷顿等更发现了知识生产的文化背景问题,而更新近的一些研究明确地指向了不同知识体系和文化体系的合作可能性问题。

这些都几乎是纯正的博弈论眼光的研究。

不过,哲学式的博弈研究不是经济学/数学意义上的标准化研究,而是“广义的”。后期维特根斯坦就已经明确地以“游戏”(博弈)为研究单位去分析所有哲学问题,无论语言、数学还是生活/日常实践。哲学化的博弈研究的意义在于它更广阔地意识到任何博弈所牵动的所有条件和所有问题这样一个彻底开放的语境,它与经济学/数学意义上的博弈论可以形成研究性的互补。

比较简单地说,经济学/数学意义上的博弈论的思想语法是:给定如此这般的条件,某个博弈或者存在着形成某种均衡的规律或者不存在确定的博弈方法。

而哲学化的博弈论的思想语法则是:任意一个博弈,它的博弈条件是否是清楚的、可以相信的和可以接受的。可以看出,哲学化的博弈研究是一种对博弈的反思性研究,它试图发现令人讨厌的但是事实上不得不考虑的“任何求解中的困难”。

毫无疑问,经济学、应用数学或其它特定的研究确实总能够“对任何困难求解”,但我们也不妨考虑任意一个困难是否合理地被给出。

非合作博弈论有着一些基本假设(其中大多数假设同时也是经济学的一般假设),比如资源稀缺;经济人(理性行为并且仅仅考虑自己的利益最大化);共同知识和互相不信任等等。其中有的假设是显然成立的,如资源稀缺。

有的则是有限成立的,如经济人和互相不信任。但无论如何,互相不信任的确是人类的主要事实(福山在《信任》一书中声称:“新古典主义经济学有80%是正确的”,而剩下的20%就被“拙劣地解释”),而如何克服不信任则是关键问题。

关于非合作博弈的研究表面上是描述非合作的规律,更深的目标其实是寻找合作之路。让人有些疑问的是关于理性行为的理解。理性行为一般地意味着总是选择能够达到利益最大化的最佳策略,而博弈论似乎特别突出了理性选择的风险规避或者说无投机原则,也就是反对赌博性选择。

为什么理性的选择就要排除冒险性呢?这一点却没有被很好地说明。不管在日常直观中还是在哲学意识中,理性并不一定排斥冒险,有时冒险甚至是必要的理性选择。

任何人在实际生活中想把任何一件事情做大,就不得不冒险;既然没有一件大事可以不冒险,那么如果想做大事,冒险就反而是一个理性选择。假如为了逻辑一致地坚持风险规避原则而反对做大事,于人类思维又恐怕太失真。

事实上政治家和投机家们甚至科学家们都在冒险,任何制度设计和任何经济政策更是冒险。人类不具备无限理性(参考休谟/海耶克关于有限理性的理论)或充分信息——由已有知识不可能推论未来,因此某种程度的冒险是必然的,而必然的就是理性的。

一般来说,博弈论的反冒险原则在一次性博弈中或者在有限步的反复长期博弈的最后一步上明显有效,这两种特定情况同样都是短期收益极大而未来收益极小,因此没人愿意冒信任对方而吃亏的险。但总体性的或大规模的人类行为虽然也是博弈性的,却很难完全以非合作博弈论这种模式去分析,而恐怕不得不引入更复杂的分析原则以及重新理解了的基本概念。

可是太复杂的行为超出了经济学的表述能力——似乎应该说超出了数学的表述能力,但数学的表述能力往往是经济学的表述偏好——因此经济学有时宁愿削足适履地迎合优美的数学表述而不愿意正确地表述事实。

博弈论的贡献不仅在于它产生了一系列据说在给定的博弈中能够相当准确地预测人类行为的可计算的分析模式,而且还在于它意味着一些有哲学深度的思想发现。其中最重要的一点可能是它突破了亚当.斯密的“看不见的手”理论,即博弈论似乎证明了个人自私的行为并不一定能够而且在许多情况下显然不能够在看不见的手的指引下产生最佳的社会共同结果,或者说,个人理性并不能保证集体理性。

不过博弈论的见解不能被理解为与看不见的手是对立的,它只是指出了看不见的手是不够的,不是形成集体理性的充分条件。

但这一有限的挑战仍然非常严峻,因为从个人理性到集体理性是在理论上所能够设想的危险最小的社会模式,通常认为这一模式既能够保证个人自由和权利又能够产生合理的利益分配,尤其能够避免极其危险的“奴役之路”。

博弈论的挑战似乎说明了古典自由主义可以是一种优美的政治理想但却是一种坏的哲学。坏的哲学往往具有这样一个模式:当把现实还原为理想之后却发现由理想无法回归到现实。

事实表明,只有合作才有最佳的共同结果,而合作又建立在信任之上,于是信任是个关键问题。从博弈论最著名的模型“囚徒困境”可以看出,两个罪犯正是因为互相不信任并且互相不敢信任而都不愿意去冒险选择抵赖罪行(如果一方抵赖而另一方坦白,则抵赖方被判10年而坦白方被释放),结果几乎必然地都选择坦白而都被判8年,这个纳什均衡是个相当糟糕的结果,因为假如互相信任就可以都抵赖而仅仅各被判1年。

这个结果显然好得太多,但是由于互相不信任,这个帕累托改进决不可能。

罪犯的心理几乎清晰可见:罪犯首先想的是决不吃任何亏的非投机原则,这已经足以决定选择坦白;进一步还会想到,假如自己坦白而对方犯傻去抵赖,则自己甚至可以获得理想的最大福利,这可以看作是希望以别人的痛苦换取自己的幸福的损人利己原则。

合起来就是“确保不受别人损害并且力求损人利己”。当然,博弈论一般只考虑“不吃亏”的非投机原则也就足够了,但“损人利己”原则实际上是逻辑蕴涵着的连带原则,因为如能做到损人利己,那就更成功了。

这两个原则的逻辑关联性会在某些情况下变得明显起来,可以考虑这样一个模式:两个心怀叵测的歹徒从银行抢了大笔钱,按照利益最大化的理性思考,他们都想到了干掉对方,再按照共同知识假定,他们都知道对方知道各自心里的想法,于是同时拔枪又同时开枪。

这个最坏的结局是一系列纳什均衡的结果。我这个例子是想说明,人们如果非常自私又缺乏信任,那么什么坏事都是可能发生的,纳什均衡可以是“都不吃亏”的结局也可以是“同归于尽”的结局,这取决于具体情况。

在缺乏信任的条件下,不吃亏就逻辑地蕴涵损人利己,因为在某些具体情况下,损人利己正是保证不吃亏的必要条件。

人们并非不想做坏事,而是在许多时候不敢做坏事(风险太大、成本太高)。个人理性、个人自由和看不见的手也许是避免奴役之路的方法,但却不是避免所有危险之路的条件。虽然不能肯定会出现什么样的危险,但是,人之间的不合作和自私自利逻辑地蕴涵着所有危险,包括毁灭性的暴力行为——我在上面杜撰的“同归于尽”纳什均衡例子实际上是对今天世界危险的暴力倾向的一个隐喻。

我们接着按照“囚徒困境”的思路来想象社会——用罪犯来隐喻现代人并不算太过分,因为任何一个自私自利的理性的利益最大化者(现代人的抽象面目)意味着是个潜在的罪犯。

不犯罪是因为没有条件,如果有条件就成为现实的罪犯,所以现代标准人即罪犯。为了获得帕累托改进,罪犯之间的信任是必要的,但这里最好先别引入道德自觉来保证信任,这要求太高,而且现在不是古代熟人社会而是现代陌生人社会,人们在人流中擦肩而过,更多的情况都具有一次性博弈的性质,因此骗子行为有利于利益最大化。

为了克服不信任,最简单的方法是利用古老的智慧去形成某个熟人共同体,从而形成共同体内部的长期反复博弈环境,长期利益作为诱惑可以保证人们愿意表现出道德水平。根据博弈论“声誉模型”,人们会为了长期利益而假装好人,一直到最后一博时才原形毕露,把道德声誉一下子挥霍完以谋取最大利益。

这个共同体就是“黑帮”(同样是隐喻的意义)。黑帮是强大的组织,组织成员只有互相合作才能得到组织提供的保护,不合作则会受到严厉惩罚,个人想对抗组织是没有希望的,因此,组织良好的黑帮能够形成帕累托改进。

不过黑帮的支持/威胁虽然可能促使囚徒去选择“抵赖”,但更多的时候还是会选择“坦白”,这不是黑帮无效而是因为国家和政府是更强大的组织。

黑帮模式不足以提供现代社会的合作条件,因为现代社会从整体上说是流动性极大的陌生人社会,这多少可以说明为什么现代社会不可能“仿古地”建立各种共同体来形成合作。现代社会尤其需要严格的制度。一个拥有内部合作的成功组织需要一个制度来保证合作的可重复性和稳定性。

制度是任何一个组织所以具有强大力量的原因,而成功的制度必须是个公正的制度,只有公正的制度才能形成巨大的力量。据说制度是长期博弈所选择的均衡结果。纳什目前关于选举代理人的研究实际上就属于一种制度建构的研究。

制度建构的问题可能是人类所有问题中最复杂、最冒险的问题,它意味着人类实现自身管理。每个人都有着各自的利益、意愿和优势资源,要满足每个人的利益在逻辑上永远不可能,因此公正问题是无解的。绝对意义上的公正是个伪问题,任何可能的制度都是不公正的。

可以这样分析:给定任意某个共同体或社会,按照自然事实,它的成员各自天赋不同(自然优势不同),或体力过人,或智力过人,或善于言辞,或善于交际,或善于学术,或善于商业,诸如此类。

而任何一种制度安排即使在分配程序上是公正的,它仍然不可能让所有人承认它是公正的。任何一种制度都相当于规定了一种游戏,有可能所有人都承认它的规则是程序合理的,但并非所有人都会承认这个游戏是实质合理的,总有些人愿意玩另一种游戏,这不是无理要求,既然我们有理由选择这种而不是那种规则,那么同样有理由选择这种而不是那种游戏。

任何一种游戏/制度都先验地规定了具有某种天赋和品格的人才能够获利,而具有另一些天赋和品格的人则只能在另一种游戏中才能获利。

比如说力大无比的人在古代可以做将军而现在只好去举重;在今天的社会里像克林顿和布什这些会讨人喜欢的人比拿破伦那样的天才更有机会当上总统,如此等等。每种游戏/制度都必定先验地赞助某些优势能力而排斥另一些优势能力(virtue),而先验地剥夺某些能力的获利资格显然不公正。

游戏的公正性不仅仅在于游戏内部规则的合理性,而且在于游戏种类的选择合理性。可是没有一个游戏/制度能够满足全面公正的要求。

人们所能够期望的只是一个“比较好”的制度。一般来说,制度总是一个共同体成员自由选择的一个均衡结果,它使得每个成员在理性地思考自己的利益时,总是没有积极性愿意打破这一均衡,它大致满足纳什均衡的条件。但是一个好的制度却需要比这种纳什均衡有着更多一些的限定(正如我们看到的,纳什均衡在更多的情况下虽然能够保证人们不比别人更吃亏,(点击此处阅读下一页)