3.1 定义 16
3.2 动态对策与静态对策的区别 16
3.3逆向归纳法 17
3.4 重复对策 20
3.4.1基本概念 20
3.4.2案例:重复对策中的“疑犯困境” 22
3.5 斯塔尔伯格寡头对策 25
3.5.1斯塔尔伯格寡头对策的定义 25
3.5.2求解斯塔尔伯格寡头对策 26
致谢 27
参考文献 27
第一章 绪论
1.1 课题的目的及意义
对策论属于数学的一个分支。随着对策论在越来越多的领域上应用,越来越多的人也渐渐开始了解与学习对策论。在前几年,对策论还是主要应用于经济领域。最近几年,对策论渐渐也涉足到其他各个领域,如:物流领域、军事领域、消费领域、计算机领域,更加贴近于我们的生活中。本课题为对策论的几种解法及其应用,可以让人们初步了解对策论问题,并认识到一些基本的应用。
1.2 国内外研究现状与发展趋势
1.3 基本概念及符号说明
1.3.1 基本概念
最优反应(Optimal reaction)[3]:对策论中,假如其他人所采取的行动是已知或者能被预测的,根据这个已知的或可预测的行动而采取的能使自己的收益最大化的战略。
收益函数(Income function)[2]:对策各方在可选择的每一个方案中,可以取得的收益。文献综述
纳什均衡(Nash Equilibrium)[2]:其他对策参与人已经选择好对策均衡时的方案,所有对策参与人都没有动机去改变自己对策均衡时所选择的方案。
子对策(Sub game)[1]:原对策的一部分,它本身可以作为独立的对策分析。
支付函数(Payment function)[3]:对策各方可选择的方案,它是各方策略的函数。
1.3.2 符号说明
:表示对策问题的人数
:每个对策参与人 所能选择的策略总计
:对策参与人 可选的策略
:每个对策参与人的策略集
:对策参与人 选择策略 的几率
:期望支付
:商品总产量
:外生常数
:贴现率
第二章 完全信息静态对策
2.1 完全信息静态对策定义
对策的各方同时进行选择自己的方案,并且所有对策参与人都对问题信息都清楚明白,这样的对策我们称为完全信息静态对策。可以用支付矩阵(payoff matrix)的方法寻找完全信息静态对策的均衡。在完全静态对策中可分为:纯策略对策、混合策略对策、纯策略和混合策略的多重对策。
2.2 混合策略对策
2.2.1混合策略的数学定义
假设 个人参加对策,每个对策参与人 所能选择的对策方案总计为 个,记每个对策参与人的对策方案集为 。其中, 表示对策参与人 可选的方案 。对策参与人 的一个混合策略是指对策参与人 在自己的对策方案集中,对每一个对策方案都赋予一个几率,记 。其中, 表示对策参与人 选择方案 的几率,并且满足 ,且 。来.自>优:尔论`文/网www.youerw.com
混合策略纳什均衡是指给定其他对策参与人在纳什均衡时选择不同对策方案的几率 ,对策参与人 没有动机改变自己在混合策略纳什均衡处的对策方案 。
混合策略均衡是指对策参与人以自己在对策方案集中赋予好的几率选出方案,让其他对策参与人在各个可能的对策方案之间没有差异。下面本文列出两个案例进行具体说明。