时滞随机系统的微分博弈理论及应用
上QQ阅读APP看书,第一时间看更新

2.1 引言

Nash博弈是指博弈参与人在博弈中同时选择自己的控制策略使得自身收益达到最大化的一类多主体、多目标优化决策问题,其对应的均衡称为Nash均衡,Nash均衡由于其在优化决策中的广泛应用受到了学者们的关注。

众所周知,线性二次问题是控制及博弈问题中最重要的问题之一。对正向随机系统,线性二次问题常会联系到一类线性的正倒向随机微分方程。Hamadène证明了博弈问题也可与线性正倒向随机微分方程相联系,他给出了博弈问题的Nash均衡点的存在性[90]。Wu进一步讨论了正倒向随机微分方程在控制及博弈问题中的应用[91]。接着Hui和Xiao研究了正倒向随机系统微分博弈的最大值原理,得到了零和博弈与非零和博弈均衡策略存在的充分必要条件[92]。Yu研究了正倒向随机系统的线性二次最优控制与非零和博弈问题[93]。Li和Wei研究了带Poisson跳情形下的正倒向随机系统的微分博弈问题[94]。Hu和Tang研究了一类倒向随机微分方程描述的非零和二次型微分博弈问题,借助一个多维对角二次型倒向随机微分方程的解得到了唯一的Nash均衡[95]

本章主要研究时滞线性随机系统的Nash博弈策略问题。主要思路是从时滞随机系统的线性二次问题出发,利用随机最大值原理分别得到状态时滞系统和控制时滞系统的最优控制策略。然后,将此方法推广到具有两个博弈参与人的Nash微分博弈问题中,基于求解一组Riccati微分和代数方程分别得到了有限时间和无限时间Nash均衡解的显式表达。进一步,将同样的思想应用到两人零和微分博弈中,其中一个博弈参与人希望指标越大,另外一个博弈参与人希望指标越小,通过求解一组Riccati微分方程而得到了最优策略的显式表达。