您好,欢迎来到伴沃教育。
搜索
您的当前位置:首页正文

名词解释

来源:伴沃教育


名词解释:

1,共同知识是指所有当事人对该事件都知道,并且也所有当事人都知道其他当事人也知道这一事件,并且所有当事人都知道所有当事人都知道这一事件。那么该事件就是共同知识。

2,先动优势:在序贯情侣博弈中,任何一方率先采取行动可能得到的好处,都比他或她后行动可能得到的好处大。这种局中人先动得益大于后行得益的情况,叫做先动优势。

3,后动优势:后行动的得益比先行动的得益大的情况

4,信息集:我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集。

• 单点集:我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位,称为单点集。

• 触发策略:即只要他的对手在博弈中一直采取合作策略,则该局中人也会在博弈中继续采取合作策略;但是,一旦对手在某一个阶段采取背叛策略,将会触发该局中人在往后的一段时期内采取不合作策略,甚至永远采取不合作策略,从而对对手实施惩罚。

• 冷酷策略:双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛。即任何局中人的一次性不合作将触发永远不合作。

• 礼尚往来策略:开始的时候和冷酷策略一样,即双方从合作开始,在以后的每个阶段,如果你的对手在最近的一次博弈中还是采取合作策略,则你继续跟他合作;如果你的对手在上一阶段的博弈中采取背叛策略,则你在下次的博弈中采取背叛策略惩罚他,但是如果你的对手在下一次博弈中改邪归正,采用合作策略,则你在下次继续博弈中还是跟他合作。

触发策略是带有奖励和惩罚措施的一种博弈机制。在这个机制中,惩罚措施是其中的关键。

注意:(1),一个信息集罩住的必须是同一个局中人的决策点。

• 必须是同一个局中人在同一个时点的决策节点。

同时,即使是同一个人在同一时点进行决策,也不一定构成一个信息集,他还必须满足:在每一个决策点他的行动选择集合必须是相同的。因为局中人在做行动选择时并不知道自己位于哪个决策点,因此,他不可能做出不同的行动选择。

简答题:

1,博弈的构成要素:

• 局中人

决策主体,目的是通过选择行动(或策略)以最大化自己的支付(效用、得益)水平。

2)行动

参与人在博弈的某个时点的决策变量。

3)策略

策略是参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。

4)信息

• ——参与人有关博弈的知识。

• 完美信息是指所有参与人在博弈进行过程的每一时刻,对所有参与人曾经采取的决策或者行动完全清楚。

• 完全信息是参与者对所有参与者的特征、策略空间及策略组合下的支付有“完全的了解”。即参与人的特征,策略空间和支付函数均为博弈各方的“共同知识”。

• 完全信息可以是完美的,也可是不完美的。

5)支付(收益)函数

• 收益(支付)函数:在特定的策略组合下参与人得到的确定效用水平,或是期望水平。

• 支付通常用矩阵来表示(一般适用于静态博弈)。

• 也可以用博弈树来表示(一般适用于动态博弈)

2,策略与行动的区别

• 如果一个博弈仅仅只是局中人一次性的同时行动对局,那么每个局中人的策略就是他能采取的行动。所以在同时决策博弈中,策略就是行动,行动就是策略。

• 但是在序贯博弈中,当局中人按决策的先后次序进行时,后行动的局中人可以对其他局中人或他自己先前采取的行动作出回应。因此,设想后行动人应该会盘算一个完整的行动计划:“如果对手采取行动A,我则采取行动X,但如果对手采取行动B,我将采取行动Y”,这个完整的计划就构成局中人在博弈中的一个策略。

行动顺序(

——同时决策

——序贯决策

同时决策——局中人在决策时不知道对手的决策或者行动是什么。被称为静态博弈。注意: “同时”不是物理概念。

先后或序贯决策——行动有先后次序,后行动者能看到先行动者的决策。被称为动态博弈或序贯博弈

策略

策略是参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。

• 纯策略:如果一个策略规定参与人在一个给定的信息情况下只选择一种特定的行动。

• 混合策略:如果一个策略规定参与人在给定的信息情况下,以某种概率分布随机地选择不同的行动。

行动与策略

在同时决策博弈中,行动就是策略。

• 但在序贯决策博弈中,行动是指每一个决策点上局中人的决策变量或行动的具体抉择。策略就是一个完整的行动计划

“垄断者”的有四个纯策略:

• 不管你怎样,我总是容忍——{容忍,容忍}

• 不管你怎样,我总是对抗——{对抗,对抗}

• 你进我对抗,你不进我忍——{对抗,容忍}

• 你进我忍,你不进我对抗——{容忍,对抗}

该博弈有八种可能的策略组合:

• ( {进入},{(上)容忍,(下)容忍} )

• ( {进入},{(上)对抗,(下)对抗} )

• ( {进入},{(上)对抗,(下)容忍} )

• ( {进入},{(上)容忍,(下)对抗} )

• ( {不进},{(上)容忍,(下)容忍} )

• ( {不进},{(上)对抗,(下)对抗} )

• ( {不进},{(上)对抗,(下)容忍} )

• ( {不进},{(上)容忍,(下)对抗} )

策略性行动可以分为:承诺、威胁和允诺。

承诺:假如轮到B要行动时,A说:“在接下来的博弈中,我将采取行动X”,这意味着无论B此时采取什么行动,A采取X行动是无条件的。这种策略性行动被称为“承诺”。

威胁和允诺是一种条件依存性的策略性行动。“如果你选择…,我会选择…”,即A所采取的行动取决于B的行为。我们称这种行动选择为反映规则或反应函数。

威胁:“除非你把碗里的蔬菜吃完,否则不准吃糖果!”

允诺:“如果你考试第一名,我带你去迪斯尼玩!”

承诺与威胁与允诺的区别

• 承诺是无条件的策略性行动

• 而威胁和允诺则是条件依存的策略性行动,属于反应函数或者反应规则的范畴。

承诺从支付上判断有时是不可信的,

• 承诺可信要满足三个条件:

• (1)可观察

• (2)不可逆转

• (3)承诺后的收益大于不承诺后的收益

• 威胁一这这如果对手采取与你利益相违背的行动,他们将遭受损失。因此实施威胁的目的在于防止他人对你做出不利的事情。

• 允诺意味着如果对手采取对你有利的行动,他们将得到好处。因此实施允诺的目的在于引导他人做出一些对你有利的事情,具有诱导功能。

子博弈

• 1、子博弈不能从第一个阶段开始,因为原来的博弈(母博弈)本身不能称为子博弈,即子博弈集合是一个真子集合。

树形博弈的子博弈

• 2、子博弈不能分割原来博弈(母博弈)的信息集。

注:只有B,C,H是子博弈,因为F后面有一支在红圈以内,另外A不是。

子博弈精炼纳什均衡

• 定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。

• 子博弈完美纳什均衡能够排除均衡策略中不可信的威胁(允诺)和承诺,因此是真正稳定的。

• 逆推归纳法(倒推法)是求完美信息动态博弈子博弈完美纳什均衡的基本方法。

• 子博弈精炼纳什均衡本身也是纳什均衡,但却比纳什均衡更强的均衡概念。

• 子博弈精炼纳什均衡能够排除不是结果的纳什均衡。例如:情侣博弈中,(足球,{足球,足球})和(芭蕾,{芭蕾,芭蕾})策略不是子博弈精炼纳什均衡,因此不是最终的结果。图见P179。

• 如果一个策略组合的某个策略成分有偏离的激励,我们可以说这个策略组合缺乏局部稳定性,不是子博弈精炼纳什均衡。

• 子博弈完美纳什均衡一定是纳什均衡,但纳什均衡不一定是子博弈完美纳什均衡。

纳什均衡:

• 均衡:所有参与人的最优策略的组合。在博弈达到均衡时,局中每一个博弈者都不可能因为单方面改变自己的策略而增加收益,于是各方为了自己利益的最大化而选择了某种最优策略,并与其他对手达成了某种暂时的平衡。

• 纳什均衡:局中人单独改变策略不会得到好处的对局策略组合。

混合策略纳什均衡:(?)

• 在静态博弈里,纯策略等价于特定的行动,混合策略是不同行动之间的随机选择。

在矩阵中用下划线法,如果一个方框中有两个数字都有下划线,即为纯策略纳什均衡,有多个为混合策略纳什均衡

纯策略纳什均衡

假定如果前锋踢向球门的左方,当守门员扑向右方时,前锋将是得分的把握80% ,当守门员扑向左方时,前锋得分的把握50%。

• 如果前锋踢向球门的右方,当守门员扑向左方时,前锋得分的把握90%,当守门员扑向右方时,前锋得分的把握是20%。注:前锋的得分,就为守门员的失分。

• 画出这个竞争博弈的支付矩阵,并求纳什均衡.

• 计算得前锋应该按概率0.7踢向左方,而守门员应该按概率0.6扑向左方。

• 这些概率使得无论对方采取什么策略,双方都得到相等的收益。即当前锋选择p=0.7时,守门员扑向左方和右方无差异,即不会影响前锋的收益,但他会乐意以0.6的概率扑向左方。同样,当守门员选择q=0.6时,前锋踢向左方和右方无差异,但他会乐意以0.7的概率踢向左方。

• 这就形成了纳什均衡。给定对方的选择,每一个参与人的选择都是最优的。

• 当p<0.7时,守门员将扑向左方;当p>0.7时,守门员将扑向右方。类似的,当q<0.6时,前锋将踢向左方;当q>0.6时,前锋将踢向右方。

计算题:

(1)古诺模型:

寡占的斯塔克尔博格模型

• 先后选择产量的产量竞争博弈

• 把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。

• 用倒推法,因此从分析厂商2的产量选择开始,再分析上一阶段的厂商1的产量选择。

• 1、先分析厂商2

• 假设P(Q1+Q2)=a- (Q1+Q2), MC2=MC1=c,没有固定成本,

厂商2的利润函数为:л2=[a- (Q1+Q2)]Q2-cQ2

利润最大化的一阶条件为:a-Q1-2Q2-c=0

即:Q2=(a-c-Q1)/2

• 2、再分析厂商1

• 由于完全信息,厂商1的利润函数为:

л1=[a-(Q1+Q2)]Q1-cQ1

• 将Q2=(a-c-Q1)/2代入上式得:

• 利润最大化的一阶条件为:a/2-bQ1=0。

• Q1=(a-c)/2, Q2=(a-c)/4。

结论:

• 1、该博弈领导者决定的产量(a-c)/2要大于追随者的产量(a-c)/4 。领导者的所得的利润也要大于追随者的利润,即“谁先动谁占优”。

• 2、斯塔克尔博格模型的产量(a-c)/2 + (a-c)/4 =3(a-c)/4要大于古诺模型的产量2(a-c)/3。因此,市场有一个领导者比各厂商势均力敌时更好。

• 两模型之间的区别:

• 斯塔克尔博格模型中两个寡头先后选择的产量之和要大于古诺模型中两个寡头同时选择的产量之和,而斯塔克尔博格模型中两个寡头利润之和则小于古诺模型的两个寡头利润之和。因此,市场有一个领导者比各厂商势均力敌时对消费者而言更好,因为斯塔克尔博格模型与古诺模型相比产量大了,价格低了。

• 斯塔克尔博格模型中博弈领导者决定的产量要大于追随者的产量,领导者的所得的利润也要大于追随者的利润,即斯塔克尔博格模型具有先动优势“谁先动谁占优。

(3)讨价还价博弈:

局中人1、2对1万元进行分配,由局中人1先提出一个分配比例,使自己得S1,如果局中人2同意就成交,若局中人2不同意,他可以拒绝,他可以重新提出分配比例使局中人1得S2;若局中人1同意则成交,不同意,他也可以重新提出分配比例,使自己得S,这时局中人2必须同意。由于讨价还价是要付出成本的,假设每次讨价还价有折损成本

• 试问这三回合的博弈中局中人1先开什么价,局中人2会同意?

因篇幅问题不能全部显示,请点此查看更多更全内容

Top