进化稳定策略都是完全理性博弈的纳什均衡(Nash Equilibrium),是纳什均衡中对有限理 性有稳健性的一部分。因此,进化稳定策略可以看作是对纳什均衡的一种选择精练。
1。4 动物的博弈 秋天,落基山脉的低温降临,雄性的麋鹿进入发情期,一只雄鹿要花费相当长的时间去
吸引雌性。这期间,雄鹿之间会产生冲突。有时候,失败者可能会在冲突中受伤。长期来看, 即便是赢家的雄鹿也可能会有一定程度上的损失,使它在冬天到来之时,在不利条件下变得 虚弱。
其实,动物的冲突不光出现在异性的抢夺中,还会出现在争抢食物、资源的过程中。比 如,一群抢食一头死亡的羚羊的狮子,彼此之间会为分食而相互争夺。此时,相互争夺的是 食物,而不是异性的生物个体,但是,争夺的本质还是相同的。
由此看来,似乎可以通过确定成本和收益以求解最优策略的优化模型,来解决动物之间 的这些冲突,但是又有着一些局限性,因为其中每个个体的最优策略都要依赖于群体之间对 手的行为来确定。
因此,可以利用进化博弈论来讨论此类情形。
2。 进化博弈的研究现状
2。1 历史背景:
2。3 国内研究现状 2。4 发展趋势
3。 懦夫博弈
懦夫博弈(Chicken Game),又被称为胆小鬼博弈,鹰鸽博弈。原理是当两个参与者都不 屈服,那么可能最坏的结果会发生。懦夫博弈是一个离散对称的博弈模型。假设现在有两个 人,以一定的钱数打赌,每人驾驶自己的汽车,面对面相向行驶。此时,有两个策略,懦夫 (Coward)会在最后时刻改变方向以避免两者相撞,但是,这会使他输掉这个赌局,而非懦夫 (Non-coward)的那一方将采取不转弯的方式前行,如果对方也不转弯那么会与对方相撞。
每一个参与者的回报依赖于对手将要执行的策略。为了计算对局的回报,我们需要知道 以下内容:①奖励或资源的价值;②获胜的成本;③获胜的概率;④失败的成本;⑤失败的 概率。
当对手采用策略 N 时,策略 C 的回报为:
E(C, N ) (C战胜N的概率) (资源的价值 - 取胜的成本)-
(C输给N的概率)(失败的成本)
表 3-1 在懦夫博弈中参与者 1 的回报矩阵
参与者 1 参与者 2
C N
C
N E(C, C) E(C, N )
E(N , C) E(N , N )
值得注意的是,E(C, N ) E(N , C) ,因为第一个是参与者 1 采取策略 C 对于策略 N 的
回报值,而第二个是他采取策略 N 对于策略 C 的回报值,这里可以认为他们俩回报值不相 等。
这个对弈当中,有两个纯策略,一个是总是执行懦夫策略,另一个是执行非懦夫策略。 然而,现实中会有人采用混合策略,即懦夫策略和非懦夫策略的结合,最后的决定可能会取 决于对方的背景或其他客观原因。表 1 中给的回报值是纯对策的回报值。文献综述
我们可以计算混合矩阵的回报值。假设 A 表示一个混合策略,概率 p 为采用懦夫策略 的概率,概率 (1p) 表示采用非懦夫策略的概率。那么,第一个混合策略可以表示为:
A pC (1p)N
同样的,用 B 表示第二个混合策略,表达式为:
B qC (1q)N
假设参与者的策略选择是独立的,那么懦夫策略将以 pq 的概率与懦夫策略相遇,懦夫 与非懦夫策略的相遇概率为 p(1q) ,非懦夫与懦夫策略的相遇概率为 (1p)q ,非懦夫与 基于鹰鸽博弈的动物行为博弈论模型(3):http://www.youerw.com/shuxue/lunwen_156892.html