吃鱼博弈 - 知猫论文

曹志

摘要：约翰·纳什发表的两篇关于博弈论的论文将博弈论引入快速发展阶段。在这之后，博弈论成为经济、社会等各个领域广泛使用的工具。然而在研究中发现，博弈论的使用集中在经济学研究中，而在社会学领域比较少。同时，大量的博弈模型虽然揭示了个人理性与集体理性的冲突，但其在指导策略选择时依然是以利己为出发点，即使是共赢的观点也如此。然而现实生活中有很多博弈的情况不是以自身对物质的占有为最终目的，恰恰相反，决策者希望对方可以占有更多。

关键词：博弈论;模型

博弈论也翻译为对策论，是一门研究理性决策者在合作与冲突之中做出决策选择的理论。博弈论最早正式提出于1944年，以冯·诺依曼和摩根斯坦恩合作出版的《博弈论与经济行为》一书为标志。事实上，博弈论的思想早在几千年前的中国就已经形成，田忌赛马就是很好的例子。博弈论刚提出之时，由于其过于抽象，理论性不强，并且需要较高的数学功底，仅被少数的数学家和经济学家所接受。真正使博弈论进入实用领域的是约翰·纳什的研究成果。20世纪50年代初，约翰·纳什名为《N人博弈的均衡点》与《非合作博弈》的两篇文章将博弈论引入经济学研究之中。约翰·纳什的文章提出了“纳什均衡”，图克定义了“囚徒困境”，泽尔腾将动态分析的观点引入博弈论，三人在博弈论的形成与演化所做的贡献共同荣获了1994年诺贝尔经济学奖。

简单地说，博弈论研究的是理性的决策主体在已知信息的前提下如何决策以使自身效用最大化。该阐述说明了博弈论构成的三个基本要素：一是决策主体，即决策的参与人，决策结果的利益相关者;二是给定的信息结构，这里的信息结构实际上就是决策主体可以选择的策略，所以也叫策略集;三是效用，是可以定义或量化的决策者的利益，也叫偏好或支付。以上三个要素构成了一个基本的博弈。事实上一个完整的博弈除了这三个基本要素外还包含另外一个要素，博弈的次序，即博弈的参加者做出决策的先后顺序。博弈参加者同时做出一次性决策的博弈称为静态博弈，参加者先后做出决策行动的博弈称为动态博弈。基于以上五个方面，博弈论模型可以用G={P，A，S，I，U}来描述。

其中，P为博弈的参与者，参与者是理性的个人、组织或团体，能够独立做出决策，并以满足自身效用最大化为目标。A为博弈参与者所有可能选择的策略的集合。根据该集合是有限集还是无限集将博弈分为有限博弈和无限博弈。S即上述博弈参与者做出决策的先后顺序，将博弈分为静态博弈和动态博弈。I为博弈信息，是参与博弈所有人的信息，博弈信息对博弈结果有着重要的影响。在静态博弈中，根据参与者是否了解其他参与者的得益状况分为完全信息博弈和非完全信息博弈。在动态博弈中，因为决策分先后，根据参与者是否了解对方在此之前的决策分为“完美信息的动态博弈”和“不完美信息的动态博弈”。U为参与者的利益，根据博弈方利益是否完全对立分为零和博弈和非零和博弈。这两者的主要区别在于是否能够在决策过程中达成一个稳定的协议。事实上，零和博弈希望达到所有参与者利益的最大化，是从集体理性思考问题并做出决策。而非零和博弈在策略选择的问题上，希望将自身利益最大化，强调的是个人理性。博弈论在引入经济学之后，根据理性经济人假设，非零和博弈是目前博弈论研究的重点。

前人研究的重点即非零和博弈是以理性经济人假设去设计博弈模型，最终得出了纳什均衡与囚徒困境。囚徒困境揭示了个人理性与集体理性之间冲突的哲学问题。不管是零和博弈还是非零和博弈，其根本追求的都是自身效用的最大，尽管零和博弈采用共赢思想，也不例外。但是不可否认博弈论推动了人类思维模式向前发展。在有共赢的可能性的情况下，我们都不应该破坏规则导致降低各自的效用。在纳什等人将博弈论引入经济学研究中之后，理论界研究的重点放在了经济学领域，而在社会生活领域对于博弈论的研究和应用较少。在博弈论的定义中，以自身效用最大化为目标是博弈论对决策者最基本的定义和要求。这种效用大多是通过对金钱、权利等对物质的占有多少来衡量。然而，在社会生活中，参与者效用可能并非这些，而且有可能恰恰相反——参与者的效用也有可能是使博弈方的效用最大，即参与者效用（精神层面的效用）的实现以博弈方效用（物质层面的效用）最大为前提。笔者发现在日常生活中存在着将他人利益最大化的博弈情景。

当儿子与母亲吃饭时，母亲会将最好的省给儿子吃。比如说有条鱼，母亲会将鱼肉省给儿子吃，而自己选择不吃。虽然她自己没有吃到鱼肉，但是她内心却获得了满足感。与此同时，懂事的儿子也希望将鱼肉给母亲吃，同样的，即使自己没有吃到他也会获得满足感。在此，母亲和儿子就是博弈的参与者，即为P，母亲用Pm表示，儿子用Ps表示。作为博弈参与者，母亲与儿子可供选择的策略各有两个，母亲可以选择吃和不吃，儿子也同样选择吃和不吃。母亲选择吃的策略用Am1表示，选择不吃的策略用Am2表示。儿子选择吃的策略用As1表示，选择不吃的策略用As2表示。母亲的策略集合为{Am1，Am2}，儿子的策略集合为{As1，As2}。与此同时用Um11和Us11分别表示母亲选择Am1和儿子选择As1时母亲所产生的效用和儿子所产生的效用。用Um12和Us12分别表示母亲选择Am1和儿子选择As2时母亲所产生的效用和儿子所产生的效用，用Um21和Us21分别表示母亲选择Am2同时儿子选择As1时母亲和儿子所产生的效用，用Um22和Us22表示母亲选择Am2同时儿子选择As2时母亲和儿子所产生的效用。

关于母亲与儿子的效用问题，值得注意的是，此处不同于在经济行为中以占有物质的多少来衡量，而是以自身的满足感来衡量。这就与经济学中的效用相反，不吃鱼导致高效用，吃鱼导致低效用。下面分析在母亲与儿子选择策略时，双方所产生效用的数量关系。

对于母亲来说，当母亲与儿子同时选择吃的策略时，母亲产生的效用水平高于当母亲选择吃而儿子选择不吃所产生的效用水平。这样避免了鱼都被母亲自己一个人吃掉，故Um11>Um12。同样对于儿子来说，Us11>Us21。

但是对于母亲来说，如果儿子选择吃的策略，那幺母亲选择不吃的策略将会比选择吃的策略产生更高的效用水平，因为这样可以让儿子吃更多的鱼，故Um11

假设1：母亲与儿子在情感上相同的。母亲所做出的不同策略选择所产生的效用与儿子所做出的不同策略选择所产生的效用在数量上是相同的。根据这个假设，可以得出Um11=Us11，Um12=Us21，Um21=Us12。

假设2：母亲与儿子都选择不吃的策略时产生的效用为0，即Um22=Us22=0。

假设3：吃鱼的数量所产生的效用是线性的，即吃的越多产生的效用越多。联系假设1，可以得出Um11=Um12+Um21。

母亲与儿子之间吃鱼博弈的效用如图1所示。

假设吃的概率是X，则不吃的概率是（1-X）。

对于母亲，所产生的效用为

Um=[Um11X+Um21（1-X）]X+[Um12X+Um22（1-X）]（1-X）

为了便于分析，令Um11=Us11=a;Um21=Us12=b;Us21=Um12=c。

又因为Um22与Us22表示母亲与儿子都选择不吃的效用，故此时效应为0。

则上述等式可写为

Um=[aX+b（1-X）]X+[cX+0（1-X）]（1-X）

变型得

Um=（a-b-c）X2+（b+c）X

当X=（b+c）/2（b+c-a）时有最大值。

因为鱼是有限的，所产生的效用是线性的，并且已经假设母亲与儿子相同，则b+c=2a，此时得到X=1。

所以，当X=1时，Um取得最大值，即母亲选择吃的策略时，其效用最大。同理可得，儿子也选择吃的时候，其效用最大。

在计算结果出来之前，笔者认为结果应该像生活中的一样，尽量不吃，尽量让对方吃，认为这才是对对方好所应该做的，才会让自己产生最大的满足感，但是结果出乎意料。在思考生活中此类问题的时候，我们都希望自己少吃一点鱼，希望对方多吃一点。这就是对于对方的爱，而当这种情况实现的时候，我们会产生满足感，也就是模型中的效用。然而通过模型的分析计算却发现，我们希望对方吃而自己不吃恰恰又不能使大家的效用最大化。而当决策者各自按照对方希望的那样做出选择，才能使得所有人都满意。

这个模型解决了之前在情景介绍中出现的问题。笔者认为，该结论存在普遍性。因为对于模型中的各个效用并没有给出特定数字，而是根据逻辑分析给出了其数量关系。对于类似的，两个博弈方的目的不是最大化自己的利益而是为了对方获得最大收益的博弈类型，该模型给出了最优解答，即双方都选择对自己有利的方案，增加自身的利益，或者说，按照对方希望自己做的那样去做就是对对方最大的帮助，使自己和对方都能获得最大的满足感。

参考文献：

[1]张维迎.博弈论和信息经济学[M].上海：三联书社，1996.

[2]谢识予.经济博弈论[M].复旦大学出版社，2001.

[3]蒋殿春.博弈论如何改写了微观经济学[J].经济学家，1997（06）.

（作者单位：扬州大学）