蓝翔图书

字:
关灯 护眼
蓝翔图书 > 职场小聪明 > 第476章 子博弈完美均衡

第476章 子博弈完美均衡(1/3)

    子博弈完美均衡(Subgame perfect Equilibrium, SpE)

    子博弈完美均衡(SpE)是纳什均衡(Nash Equilibrium)的一种强化形式,专门用于动态博弈(dynamic Games),特别是那些包含多个决策阶段的博弈。SpE要求在**每一个可能的子博弈(Subgame)**中,策略都必须是一个纳什均衡。

    1. 子博弈完美均衡的定义

    一个策略组合构成子博弈完美均衡,当且仅当它在博弈的每一个可能的子博弈中都形成纳什均衡,即:

    ?玩家在每一步都必须选择最优策略,不论游戏是否已经按照这个路径进行。

    ?通过**逆向归纳法(backward Indu)**来求解SpE。

    SpE解决了纳什均衡可能包含不可信威胁的问题。例如,在某些博弈中,某些威胁在理性情况下根本不会被执行,而纳什均衡可能会包含这些威胁。而SpE要求策略在所有子博弈中都合理,因此排除了这些不可信的威胁。

    2. SpE的求解方法:逆向归纳法

    求解子博弈完美均衡的主要方法是逆向归纳法(backward Indu),步骤如下:

    1.从最后一个决策节点(终局)开始,找出最优策略。

    2.回溯到前一个决策节点,在考虑后续最优策略的情况下,找到当前的最优选择。

    3.依次回溯,直到回到博弈的起点,最终得出整个博弈的最优策略组合,即SpE。

    3. 经典案例分析

    (1) 讨价还价博弈(Rubinstein bargaining Game)

    场景:

    ?两个玩家A和b协商如何分配100元。

    ?A先出价,b可以接受或拒绝:

    ?接受:按A的分配方案执行。

    ?拒绝:进入下一轮,由b出价,但总金额减少(如因折现或时间成本,变为90元)。

    ?这个过程可以继续,直到某一方接受提议。

    解法(逆向归纳法):

    1.在最后一轮,b必须接受任何非零金额,因为否则大家都拿不到钱。

    2.在倒数第二轮,A知道b在下一轮会接受,因此A会给b最少的钱,以确保自己利益最大化。

    3.依次回溯,最终得出SpE,A在第一轮出一个合理的价钱让b接受,而b接受,因为等待对b来说更不划算。

    (2) 进入威胁博弈(Entry deterrence Game)

    场景:

    ?新企业E考虑进入市场,已有企业I可以选择降价竞争(Fierce)或维持高价(Acmodate)。

    ?如果E不进入,I赚15,E赚0。

    ?如果E进入:

    ?I选择降价,I 和 E 都亏损 -10。

    ?I选择高价,I赚10,E赚5。

    解法(逆向归纳法):

    1.最后一步:如果E已经进入市场,I的最优策略是维持高价(因为降价会亏损)。

    2.回溯:E知道I不会真的降价打压,所以E会进入市场。

    3.结论:SpE是E进入,I维持高价。

    这显示了SpE如何排除不可信威胁(即I宣称要降价,但实际上不会)。

    (3) 信号博弈(Job market Signaling)

    场景:

    ?求职者(worker)可以选择是否上大学(成本c)。

    ?雇主(Employer)决定是否提供高薪(h)或低薪(L)。

    ?如果雇主认为求职者能力高,就提供高薪,否则提供低薪。

    解法(逆向归纳法):

    1.雇主的决策(最后一步):

    ?如果看到求职者上大学,则认为其能力较高,给高薪。

    ?如果未上大学,则给低薪。

    2.求职者的决策(回溯):

    ?如果求职者能力高,上大学的成本c较低,愿意去。

    ?如果能力低,上大学的成本c较高,不愿意去。

    3.SpE:

    ?高能力者选择上大学,雇主提供高薪。

    ?低能力者不选择上大学,雇主提供低薪。

    这个模型解释了为什么学历可以作为一种信号,即使它本身不一定直接提高生产力。

    4. SpE的应用

    (1) 经济与商业

    ?定价策略:大公司是否降价以阻止新竞争者进入市场。

    ?供应链谈判:零售商与供应商的长期合作策略。

    ?拍卖:竞标者如何制定长期竞标策略,以最大化利益。

    (2) 政治与国际关系

本章未完,请点击下一页继续阅读》》
『加入书签,方便阅读』
内容有问题?点击>>>邮件反馈