蓝翔图书

字:
关灯 护眼
蓝翔图书 > 职场小聪明 > 第475章 逆向归纳法

第475章 逆向归纳法(1/2)

    逆向归纳法(backward Indu)

    逆向归纳法是一种常用于动态博弈的求解方法,核心思想是从博弈的最后阶段开始推导,逐步回溯,找到最优策略。

    这种方法通常用于有限步博弈(finite games),尤其是在完全信息动态博弈中,即所有参与者都知道游戏规则和其他玩家的可能选择。

    逆向归纳法的基本步骤

    1. 从最后一步开始分析:假设已经到达博弈的最后一个决策节点,找出在此节点上每个玩家的最优策略。

    2. 回溯至前一步:假设前一个决策者知道后续的最优选择,并据此做出最优决策。

    3. 重复以上过程,直至回溯到起点:最终得出的策略就是整个博弈的最优均衡解。

    案例分析

    1. 终局博弈(Ultimatum Game)

    假设有两个玩家:

    ? A玩家分配100元,决定给b玩家多少钱(整数)。

    ? b玩家可以选择接受(Accept)或拒绝(Reject):

    ? 如果接受,双方按A的分配拿钱。

    ? 如果拒绝,双方都拿不到钱。

    逆向归纳分析

    1. b的决策(最后一步):

    ? 如果b接受,他能获得分配到的钱。

    ? 如果b拒绝,双方都拿不到钱。

    ? 理性b玩家应接受任何非零金额,因为比0更好。

    2. A的决策(回溯):

    ? A知道b会接受任何非零金额,所以A的最优策略是给b最少的钱(如1元),自己拿99元。

    结论:A分1元,b接受,这是均衡策略。

    2. 进入威胁博弈(Entry deterrence Game)

    假设一个新企业(E)考虑进入市场,而已有企业(I)可以选择降价竞争(Fierce)或维持高价(Acmodate)。

    博弈树

    1. E决定是否进入市场:

    ? 进入(Enter)

    ? 不进入(Stay out)

    2. 如果E进入,I决定策略:

    ? 降价(Fierce):I 和 E 都亏损 -10。

    ? 高价(Acmodate):I赚10,E赚5。

    ? E不进入(Stay out):I独占市场,赚15,E赚0。

    逆向归纳分析

    1. I的决策(最后一步):

    ? 如果E已进入,I在降价(-10)和高价(10)之间选择,高价更优,所以I会选择高价。

    2. E的决策(回溯):

    ? 知道I不会降价,E进入后可以赚5(比0好),所以E会进入市场。

    结论:E进入,I维持高价,这是均衡策略。

    3. 百吉饼博弈(tipede Game)

    假设有两个玩家轮流决定**“拿走(take)”还是“继续(pass)”**奖金池:

    ? 初始奖金池2元,每轮增加。

    ? 如果某人“拿走”,他获得大部分奖金,另一个人获得少部分。

    ? 游戏最多持续4轮。

    逆向归纳分析

    1. 最后一轮:

    ? 若轮到玩家b,他会“拿走”,因为这是他的最后机会。

    2. 倒数第二轮:

    ? 玩家A知道b会在下一轮拿走,因此他会在这一轮就拿走。

    3. 第三轮:

    ? 玩家b知道A会在下一轮拿走,因此他会在这一轮就拿走。

    4. 回溯至第一轮:

    ? A知道b在下一轮会拿走,所以A在第一轮就拿走。

    结论:尽管合作能让奖金池增大,但完全理性玩家会在第一轮就终止游戏。

    总结

    ? 逆向归纳法适用于有限步动态博弈,从最后一步开始推导。

    ? 它能帮助玩家预见对手的最优策略,做出最优决策。

    ? 适用于终局博弈、市场进入、谈判、竞标等策略决策。

    逆向归纳法的应用

    逆向归纳法广泛应用于经济、商业、政治、军事、人工智能等领域,特别适用于动态决策问题,即决策者的选择会影响未来的结果。以下是几个典型的应用场景:

    1. 经济与商业

    (1) 定价策略

    企业在制定长期定价策略时,会考虑竞争对手的反应。例如:

    ? 掠夺性定价(predatory prig):

    ? 大企业A希望阻止小企业b进入市场。

    ? A可以选择降价打压,b需要决定是否进入市场。

    ? 
本章未完,请点击下一页继续阅读》》
『加入书签,方便阅读』
内容有问题?点击>>>邮件反馈