博弈论
名词解释:
1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。
4、常和博弈:是指博弈双方的得益总和为非零的常数
变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响
6、战略:参与人在给定信息集的情况下的行为规则的完备描述。
7、均衡:所有参与人的最优战略组合。
8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。
9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。
10、重复剔除劣战略的占优均衡:首先到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。
11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。
12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。
13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:
(1)决策结x是单结信息集;
(2)在一个信息集的决策结必须是同一个决策结的后续结。
14、子博弈精炼纳什均衡:如果一个纳什均衡中的各个子博弈的战略在每一个子博弈中都是最优的,即构成纳什均衡,则称该博弈为子博弈精炼纳什均衡。
15、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动;
动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
16、重复博弈:给定一个标准博弈G(动态/静态)重复进行T次,并且每次重复G之前,以前的博弈的结果各个博弈方都能观察到,这样的博弈过程成为“G的T次重复博弈”,记为G(T),G称为G(T)的博弈阶段。同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。
17、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。
18、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确
知识的博弈。
19、类型:一个参与人所拥有的私有信息,是其个人特征的完备描述,博弈人知道,其他人不知道。
20、博弈的战略式表述:(1)参与人集合(2)每个参与人的战略集合(3)参与人的支付函数
博弈的扩展式表述:(1)参与人集合(2)参与人的行动顺序(3)参与人的行动机构
(4)参与人的信息集(5)参与人的支付函数(6)外生事件的概率分布
21、信息集:每次行动时,参与人知道什么;参与人在决策结上所拥有的信息的集合,拥有同样信息的决策结属于同一个信息集,即信息集包含的决策结拥有同样的信息。
22、颤抖手均衡:在任何一个博弈中,每一个博弈方都有一定的概率出现错误,一个战略组合,只有当其在允许所有博弈方都可能犯错误时,仍然是每一个博弈方的最优策略时,才是一个颤抖手均衡。
实例名词解释23、序贯理性:在每一个信息集中,应该行动的参与人对于给定该参与人在此信息集上的推断,以及其他参与人随后的战略必须是最优反应,即在任何后续博弈中都是理性的。
24、推断理性:在处于均衡路径和非均衡路径的信息集上,推断由贝叶斯法则及参与人的均衡战略决定。
25、海萨尼转换:在处理不完全信息博弈问题中,引入一个虚拟的参与人“自然”,自然首先行动决定参与人的特征,参与人知道自己的特征,其他参与人不知道。
26、不完全信息博弈:在博弈中至少有一个博弈方不完全清楚其他博弈方的得益函数。
27、后续博弈:每一个信息开始的博弈的剩余部分。
28、贝叶斯纳什均衡:是一种类型依从战略组合,在给定自己类型和其他参与人的类型的概率分布情况下,每一个类型依存战略使得每个参与人的期望效用最大,也就是说,没有人有积极性选择其他战略。
29、逆向归纳法:从博弈树行动的相反顺序,从后往前依次求得各自博弈的纳什均衡。
30、信号传递博弈:
31、机制设计激励相容约束:给定委托人不知道代理人类型的情况下代理人在所设计的机制下必须有积极性选择委托人希望他选择的行为,也就是说,只有当代理人选择委托人所希望的行为时得到的期望效用不小于他选择其他行为时得到的期望效用时,代理人才会有积极性选择委托人所希望的行动。
32、机制设计参与约束:如果要一个理性的代理人有任何兴趣接受委托人设计的机制(从而参与博弈)的话,代理人在该机制下得到的期望效用必须不小于他在不接受这个机制时得到的最大希望效用。
33、间接机制:参与人声明自己的类型依附战略,战略是除类型以外的信号,如拍卖中的声明报价。
34、直接机制:参与人直接声明自己的类型,而所声明的类型可能不同于真实类型,如拍卖中声明对拍卖品的估价。
二、简答题
(1) 将博弈的信息特征和行为时间特征结合,博弈分为哪几类,并分析几种类型博弈的特点?答:将博弈的信息特征和行为时间特征结合,可以把博弈细分为下面四种类型的非合作博弈:
静态博弈:是指所有博弈方同时或可看作同时选择策略、采取行动的博弈。
动态博弈:是指博弈方的选择、行动有先有后,而且后选择、后行动的博弈方在自己进行选择、行动之前可以看到在他之前选择、行动的博弈方的选择、行动的博弈。
完全信息博弈:是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。
不完全信息博弈:是指参与者只了解上述信息中的一部分的博弈。
(2)博弈论博弈论产生与发展过程?
答:1、萌芽阶段(1944年以前):古诺(Cournot,1838,法国经济学家)模型(同时决策的产量博弈);斯坦克尔伯格(1934,Stackelberg,德国经济学家) (不同时决策的产量博弈)
2、产生阶段(1944年-1959年):冯·诺依曼和摩根斯特恩合著《博弈论与经济行为》(1944年),博弈模型的解的概念和分析方法,理论基础,主要合作博弈,非合作零和博弈;纳什均衡(完全信息静态)(1950,1951),论文“N人博弈中的均衡”点(50年),“非合作博弈”(51年),提出了非合作博弈均衡解,并证明了均衡解的存在,纳什均衡基本思想:在解集中所有博弈者的策略都是对其他博弈者所用策赂的最佳对策
3、发展阶段(1960年-1979年):精练纳什均衡(完全信息动态)(泽尔腾,1965),1965年论文《一个具有需求惯性的寡头博弈模型》,德国波恩大学教授,数学家、经济学家;贝叶斯纳什均衡(不完全信息静态,海萨尼,1967)与贝叶斯精练纳什均衡(不完全信息动态,海萨尼,1975),美国加州大学教授,经济学家
4、繁荣阶段(1980年以后):纳什,泽尔腾和海萨尼共同获得诺贝尔经济学奖(1994);维克里和莫里斯获诺贝尔经济学奖(1996),2001,2005,2007年诺贝尔经济学奖,不对称信息下激励理论。
(3)博弈论成为经济学主要课程的成因是什么?
答:1)博弈论在经济学中的应用越来越广泛. 博弈论许多成果也是借助于经济学的例子来发展的, 相比其他领域来说,在经济领域应用最为成功的,已经形成了一套完整的经济博弈理论,并且发挥了巨大经济效益。
2)经济学和博弈论的研究模式是一样的,这就是强调个人理性.也就是在给定的约束条件追求效用最大化。在这一点上,博弈论与经济学是完全一样的,使得博弈论分析方法在经济分析中发挥着重要作用。
3)传统经济学研究个人行为时,总是假设其外部环境是给定的。现代经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和作用,这与博弈论研究内容相一致,所以,随着现代经济学的发展,博弈论显得更加重要。
4) 经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。而博弈论不完全信息博弈模型正是解决这类问题的有效工具。
5) 博弈论和信息经济学专家获得了诺贝尔经济学奖,凸现了“博弈论”在主流经济学中日益重要的地位。
(4)博弈有哪几大要素,并解释几大要素的内涵?
答:规则:规定博弈各方的行动顺序、方式、以及最终的结果等。
局中人(Player, 选手,玩家):博弈参与人
战略:一整套的行动方案,规定了各种情况下的行动。如人不犯我,我不犯人;人若犯我,我必犯人。
行动:局中人行为。
信息:在行动时所掌握的信息。
报酬(payoffs, 支付):博弈结束时,各方得到的收益。
(5)混合策略和不完全信息博弈联系与区别
答:共同点:博弈参与人不能够确切知道其他博弈参与人的选择行为,只知道选择行动的概率分布;不同点:前者的不确定性只是因为各博弈方为了不让其他博弈方占任何先机而必须故意随机选择行动,后者的不确定性源于其他博弈方的类型,即类型的不确定性,按照期望支付选择最优战略(纯战略)。
(6)战优均衡、重复剔除劣战略的战优均衡和纳什均衡相互之间的关系是什么?
答:几个均衡之间的关系如图:
在重复剔除的占优策略均衡中.最后剩下的惟一策略组合,一定是在重复剔除劣战略过程中无法被剔除
的战略组合。因此,重复剔除的占优战略均衡也一定是纳什均衡。
(7)简述子博弈精练纳什均衡的理性要求
答:逆向归纳法理论要求的“所有参与人是理性的,并且要求参与人知道其后续参与人是理性的;参与人知道其后续参与人知道其后续参与人是理性的”,等等。上述理性要求大大高于静态博弈中的理性要求。在动态博弈中有时不能满足理性要求导致子博弈精炼纳什均衡不存在。
(8)信息经济学与博弈论不同点
答:信息经济学是非对称信息博弈论在经济学上的应用,非对称信息指的是某些参与人拥有但是另一些参与人不用有的信息。
1)博弈论是方法论导向的,而信息经济学是问题导向的。
2)博弈论研究目的:结定信息结构,均衡结果是什么;信息经济学研究的目的:给定信息结构,契约安排是什么。
3)博弈论研究方法涉及经济、军事、政治、日常生活等,信息经济学只研究经济领域方面的问题。
4)博弈论包括完全信息和不完全信息模型,而信息经济学重点研究非完全信息博弈问题。
(9)信息经济学的基本分类
答:信息的非对称性划分标准:非对称信息发生时间和非对称信息的内容。
按非对称信息发生时间分:
1)事前非对称:在签约之前存在的非对称信息。相应的研究问题为逆向选择问题,相应的模型为逆向选择模型。
2)事后非对称:在签约之后存在的非对称信息。相应的研究问题为道德风险问题,相应的模型为道德风险模型。
按非对称信息的内容划分:
1)隐藏行动:研究不可观测行动的模型
2)隐藏知识(或称隐藏信息):研究不可观测知识的模型
三、计算题
(1)求纳什均衡
(2)求混合战略纳什均衡
(3)博弈的战略式和扩展式表示
(4)求子博弈精练纳什均衡
(5) 求贝叶斯纳什均衡
四、联系实际,举一些有关博弈论应用实例(至少3个),并用博弈知识进行分析.
1、参与人甲有三种战略A、B、C,参与人乙有三种战略D、F、G。相应的支付如图,且双方同时行动。求出所有的纯战略纳什均衡。
2、博弈人甲与博弈人乙的支付如图,且双方的支付为共同知识。求该博弈的混合战略纳什
均衡。