远见与创新: 博弈论初探

博弈论挺有意思。

博弈论研究的是游戏中的各方如何能够动态地达到平衡。它研究游戏参与者的交互，帮助参与者确定战略，也试图预测游戏的最终结果。

博弈，太普通了，象吃饭喝水一样，是人类与生俱来的本能，也是自然界中万物进化遵循的准则。但越是普通的东西，越难以找准它的本质。

对博弈论的数学化研究起源于Jone von Neumann。这位伟大的工程师总是以他独特的视角来研究自然的奥秘，并带来激动人心的、单纯而又优美的结论。1944年，他和Oskar Morgenstern对动态的博弈过程进行了定量的数学分析，使博弈成为一项可以进行数学分析的研究。

此后，博弈论的系统研究不断为一些已往难以分析的社会问题的研究提供独特视角和系统研究的工具，从而越来越被人们所重视。20世纪70年代，博弈论初步成熟，然后，博弈论的创始人纳什获得诺贝尔奖的殊荣，确定了博弈论在人类探索自然奥秘的旅程中应有的地位。

两个简单的例子。

1、在博弈论未有之前，现代政治学的奠基之作－Hobbes的《列维坦》通过发现：对个人没有任何限制的社会将导致"所有人对抗所有人的战争"来证明政府的合理性，看起来无懈可击。博弈论说明了他的发现是一个非常单纯的一次性博弈的事例，具有很大的局限性。

2、亚当.斯密（Adam Smith）基于他对自由市场的分析发现：市场中各方的充分自由竞争能够带来对资源的最佳配置。博弈论说明了他的研究是建立在"完美竞争"这一虚假的假设上的，即：没有进入、退出成本，没有规模效益，没有成员的互相作用，因此在现实社会难以存在，更不足以指导这个真实世界的行为。

那么，现代博弈论包括了那些内容呢？

博弈论的核心在于研究游戏参与者的"交互"，就是一方的动作要受到其他各方动作的影响，这就导致它研究的是相互作用的动态过程。

在博弈论中对博弈的表述通常有两种结构：矩阵和树。矩阵能够一目了然地显示出博弈各方权衡的依据，从而制定战略，而树能使参与博弈的各方通过对各种情况的一个个分析，来得到自己应该做出的动作。

而对博弈分析可以定性，也可以定量。非常有名的博弈例子－囚徒困境就可以定性分析。在囚徒困境中，因为对另一方行为不确定性的恐惧，囚徒最后都选择认罪，以避免自己拒绝，另一方认罪导致自己负全责的最坏的结局。

零和游戏的特点是：一方的得1就是另一方的失1，现实社会中也有可能各方有各自的利益取向，导致一方的得1只是另一方的失0.5，这就需要von Neumann－Morgenstern 的定量分析把各方的不同权重归一化、同时估计他方的权重以引人自己的分析，最后得到自己的方案。

纳什（Nash）对博弈论科学的开创作用在于，他扩展和提炼了Jone von Neumann和Oskar Morgenstern的定量分析方法，从学科的高度将这门科学概括为寻找博弈中的"纳什均衡"（NE：Nash Equilibrium）。"纳什均衡"，就是在博弈中达到的这样一种均衡：没有一方可以通过单方面改变自己的动作来改善自己的利益。囚徒困境的结局就是这个游戏的唯一的NE。而Hobbes的分析结果也是他的游戏的唯一的NE。

囚徒困境中一个重要特点是游戏是一次性的，因此囚徒们不必担心未来受到报复，从而带来系统的非最佳结局。而现实世界中，还有重复性的游戏，那就是游戏参与者需要长期一轮接着一轮博弈。博弈论发现，不同于一次性游戏，重复性游戏可以导致合作。

重复性游戏需要一些规则来获得合作。最著名的一个规则就是tit-for-tat。它要求参与者遵循两个规则： 1、在第一轮永远合作，2、第一轮以后采取和对方同样的动作就好了。在这两条规则的保证下，参与者在游戏中将永远合作。

目前流行的BT下载工具正是采用tit-for-tat方法，使全世界的下载用户空前地合作，使下载率达到最大，给参与游戏的所有人都带来巨大的好处。

但tit-for-tat需要两个条件才能实现：1）参与者不知道什么时候游戏将结束重复。一旦参与者知道游戏将会最后结束，他就可以只顾自己，不再合作。2）合作和不合作能够被完美地鉴别，偶然的问题不会干扰判别。

对照BT来看。第一条在BT中就存在问题，并导致了BT的种子消失问题。那就是当参与者的文件下载完毕时，对他来说游戏就清楚地结束了，所以他可以不再合作而下线，导致种子消失。第二条在BT中通过适当的容忍来避免偶然的异常导致系统进入不合作的恶性循环。

除了tit-for-tat，承诺（Commitment）和名声（Reputation）也能导致合作，比如美苏争霸时期，他们都斩钉截铁地表示一旦被核攻击一定以牙还牙，从而导致两者合作，谁也不动。而IBM尽力维护自己笔记本的高质量，是为了维护自己的声誉。

前面大概介绍了日常生活中游戏中的博弈问题，另一方面，自然界中也存在博弈呢！

自然界中的博弈不是你争我夺，而是以另一种更有趣的方式展开，那就是比看谁的后代多。

分析自然界中的博弈，即常说的进化博弈，需要引入了一个新的均衡：进化稳定战略（ESS：Evolutionary Stable Strategy）均衡。它是这样一种均衡，即：在这种均衡下，某一种群改变自己的阵营或者种群突变都不能影响到整个生态系统最后的组成比例。比如下面的例子。

在这个例子中，人被分为三种： 1、公平者：只要求一半，2、谦让者: 只要求1/3
3、贪婪者：要求2/3 ，游戏规则是：当两方相遇，要求达不到的参与者一点也得不到。

分析这个游戏发现，它存在两个ESS： 1、一半人是谦让者、一半人是贪婪者；2、所有人是公平者。而进一步的分析还发现：能否达到公平者的ESS取决于公平者在游戏开始时占总人口的比例。在一般情况下，如果这个初始比例超过33％，公平者最终能够到达他的ESS，而如果初始比例小于33％，那么公平者将会愈来愈少，直到灭绝。

这真是一个有趣的发现。这就是说，公平者需要抱成团，因为孤独的公平者一定会被贪婪者灭亡，而贪婪者却不需要怕孤独，因为再怎么样，他也不会灭亡。按着这个方向研究最后发现：相关性非常有助于公平者。这个相关性就是指同类的人相遇的机会比较多（因为互相模仿、或者遗传基因相似性等）。小小的0.1的相关性就使那个33%的初始门限可以大大下降。相关性非常有利于公平者的生存，而不利于贪婪者的生存。真是有意思。

还好，Web2.0和SNS不就是促进相关性的最好的工具吗？真不错！:-)

【参考文献】Game Theory, Standford Encyclopedia of Philosophy, Jun 2003.

更新：在梁宁的闲花照水录中她提到："我个人一个最基本的理论是，如果他还会找你，他基本不会坑你；如果是最后一次合作了，那么出事概率极高。所以和合作伙伴的每次商业合作，都要考虑是否会是最后一次。"是tit-for-tat的第一个条件的现实事例。

Technorati : Game Theory, 博弈论

标签：研究

远见与创新

2006-03-27

博弈论初探

0 Comments:

About

我的简介

Previous