博弈学习通信抗干扰理论与方法
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.3.2 Stackelberg博弈

Stackelberg 博弈[81-85]是一种典型的分层博弈,将博弈参与者分为两种类型,即领导者(Leader)和跟随者(Follower)。先行进行行动的博弈参与者一般建模为领导者,在领导者的策略之后,再进行决策的博弈参与者为跟随者。Stackelberg 博弈又称为主从模型(Leader-Follower),在该模型中上层的领导者先行决策并采取动作,具有一定的“先发优势”,下层的跟随者观察到上层领导者的动作后再做出响应。一般来说,领导者和跟随者具有不同的效用函数,跟随者的效用函数可以理解为领导者效用函数求解的一个约束条件。Stackelberg博弈作为一种非合作博弈的扩展,具有分层特性,在建模具有分层架构的优化问题中具有独特的优势,适用于刻画具有层级关系的博弈参与者之间的竞争和合作关系。该博弈模型可以刻画两个层面的竞争,即上层参与者和下层参与者之间的竞争,也可以刻画层内(下层或上层)间参与者之间的竞争。

Stackelberg博弈主要用于建模分析具有分层特性的优化问题[81-85],可以采用逆向递推法求解两层优化问题,即先求解下层子博弈(Follower Sub-game),然后将结果代入上层子博弈(Leader Sub-game),从而求解该问题。因而,对于一个Stackelberg博弈问题,可以等效看作求解一个分层优化问题,即通过领导者和跟随者之间的策略调整,在下层跟随者效用函数的约束下求解上层领导者的优化问题。对于这类问题,可结合优化理论进行问题求解。若要将Stackelberg博弈用于建模分析具有离散特性的分层问题,则需借助于分层学习架构,采用学习方法进行问题求解。