策略到纳什博弈

策略式博弈和纳什均衡

一个简单的博弈

如果一群猎人去打猎，目标是一头鹿。为了成功，他们意识到必须坚守自己的岗位；但是，当一只兔子从其中一个人的眼前跑过，他会毫不犹豫的去追逐它，一旦他捕获了兔子，他就不关心同伴是否错失了他们的目标——鹿。¹

为形成一个简单博弈，假设：

只有两个猎人，他们必须同时决定是猎鹿还是兔子。
如果两个人均决定猎鹿，那么他们会得到一头鹿，并平。
如果两个人均决定猎兔子，那么他们每个人可以获得一只兔子。
如果一个猎兔子而另一个猎鹿，则前者获得一只野兔子，后者一无所获。
对每个猎人来说，半头鹿比一只兔子要好。

通过上述5个假设条件，狩猎就形成了一个简单的博弈，即两个参与者在两种策略中选择–猎鹿或猎兔子–他们选择作为收益的猎物。下表列出了不同策略的收益，例如策略4，一个人猎兔子，另一个人猎鹿，收益兔子的效用为2，无收获的效用则为0。

策略	收益
假设2	(4,4)
假设3	(2,2)
假设4	(0,2)

对于这个博弈，存在两种情况的均衡。第一个是合作，即两个人都猎鹿就是一种均衡，或者称为"纳什均衡"，其中没有一个参与者会单方面改变策略的动机，据此猎鹿是种可能的结果；第二个是不合作，每个参与者都相信另外一个参与者会改变策略，那么猎兔子对于参与者自己是种更合理的收获。因此作为不合作的结果，两个人都会猎兔子--也是一个“纳什均衡”。

上述暗含如下结论：

合作绝对不是一种预设结论，即合作不是只能在参与者事先商讨的情况下才会达成，也有可能通过博弈背景和参与者预期等因素的作用下同样产生了非预定的合作。

策略式博弈和重复严格优势的介绍

策略式博弈

首先介绍策略式²博弈，由三种元素组成：参与者、策略及收益。根据 Von Neumann-Morgenstern的假定³，有：

参与人集合\( i\in \mathfrak{F} \), 此处设为有限集合 \( i = \{1,2,\dots,I\} \)
对于每个参与人 \( i \) 有

纯策略空间 \( s_i \in S = \{s_i| s_1, s2,\dots,s_I\} \),
收益函数 \( u_i:s_i \rightarrow u_i(s_i) \)

st=>start: Start
op=>operation: Your Operation
cond=>condition: Yes or No?
e=>end
st->op->cond
cond(yes)->e
cond(no)->op

卢梭，论人类不平等的起源和基础. Ordesbook, 1986 ↩︎
也叫做“标准式”，曾经的标准术语。现在许多博弈论论述中倾向于采用“策略式”，原因是这一表述暗含参与者的策略式模型的首要因素。 ↩︎
期望效用函数理论是20世纪50年代,冯·纽曼和摩根斯坦(Von Neumann and Morgenstern)在公理化假设的基础上，运用逻辑和数学工具，建立了不确定条件下对理性人(rational actor)选择进行分析的框架。不过, 该理论是将个体和群体合而为一的。 ↩︎

博弈论