首页 > 综合百科 > [知识回顾]逆向递归法

[知识回顾]逆向递归法

时间:2023-09-06 01:00:26 浏览量:

一般地,对于完全信息动态博弈,我们可以运用逆向归纳法求出子博弈精炼纳什均衡,所谓“逆向归纳法”,就是按与博弈顺序相反的方向逐一找出每一个参与人在其所有决策结上的最优行动选择,直到第一个博弈树的第一个决策结为止。由所有局中人最优行动选择构成的一条路径就是一个纳什均衡。该方法建立在如下逻辑上:先行动的参与者在前面阶段选择行动时必然会考虑到对手随后如何行动,只有在博弈的最后一阶段进行决策的参与者,因为不再有后顾之忧,才能直接作出明确的选择,如此,前一阶段参与者的行动选择也就定下来了。

定义:逆向递归法(backward induction):从动态博弈的最后一个阶段博弈方的行为开始分析,每一次确定出所分析阶段参与人的行动选择和路径,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。

利用逆向归纳法求解图3.7的子博弈精炼Nash均衡。

在图2.5所给出的博弈树中,首先,在倒数第一个进行行动选择的参与人顺序开始,我们在这个参与人的所有倒数第一个决策上进行最优行动选择:对于参与人1而言,X7和X9为其最优行动,按照这一步骤,接下来参与人2在和的选择中,肯定会选择即X4和X10,这样回到起点,参与人1的最优行动选择为L。

根据已完成的各个决策结上的最优行动选择,我们来看看该博弈模型将会作出什么样的预测。首先,当博弈开始时,参与人1面临在两个行动L和R之间进行选择的问题。他知道,如果选择L则对手将选择,最后轮到1自己再度进行选择时,他将选择X7,获得支付3;相反,如果他开始选择的是R,则对手仍将选,自己获得支付2。因此,参与人1在博弈开始时会选择L,因为L是他在第一次进行行动选择时的最优行动。正如1所预料的是对手随后将选,然后再由自己选X7,博弈结束。这样,我们凭直觉认为行动组合构成的路径是均衡路径,而纳什均衡就应该是战略组合。其中,我们在参与人1的战略表达中按其进行行动选择的顺序写出对应的行动选择,而在同一行动选择顺序中,我们按博弈树中从左到右的顺序写出对应的最优行动。

作为动态博弈分析最重要、最基本的方法,逆向归纳法基于连续理性原则(参赛者在每一步骤上均追求效用极大)可以将Nash均衡中不合理的、不可置信的行动(或威胁)剔除掉,因此,从本质上讲逆向归纳法是一种重复剔除劣战略的过程。从逆向归纳法求解子博弈精炼Nash均衡的过程可以看到:在求解任一子博弈时,参与人在该子博弈的初始决策结上的选择,对余下的博弈进程而言是最优的。

     

   同时此子博弈精炼Nash均衡,在一定程度上满足动态规划的最优性原理,对于完美信息 (perfect information)的博弈问题尤为适用,即在博弈的任何决策时点上,子博弈精炼Nash均衡都能给出参与人的最优选择。

   

由于子博弈精炼纳什均衡在任一决策结上都能给出最优决策,这也使得子博弈精炼Nash均衡不仅在均衡路径上给出参与人的最优选择,同时在非均衡路径(除均衡路径以外的其它路径)上也能给出参与人的最优选择。所以,子博弈精炼纳什均衡不会含有参与人在博弈进程中不合理的、不可置信的行动(或战略)。这就是子博弈精炼Nash均衡与Nash均衡的实质性区别。此时的策略是“万全之策”,而不再是单纯的行动!
博弈论, 博弈, 行动, 均衡

© 格特瑞咨询-验资网 版权所有 | 黔ICP备19002813号

免责声明:本站内容仅用于学习参考,信息和图片素材来源于互联网,如内容侵权与违规,请联系我们进行删除,我们将在三个工作日内处理。联系邮箱:303555158#QQ.COM (把#换成@)