1.1 博弈学习通信抗干扰的研究背景
随着无线通信技术的迅速发展以及各领域对其依赖性的日益增强,各种类型的攻击正给无线通信及相关领域的安全带来巨大挑战。由于无线环境的开放特性,无线通信系统容易遭受各种类型的攻击,如窃听者攻击、数据篡改攻击以及干扰攻击等[1-6]。本书主要关注干扰攻击,它作为无线通信安全的一个重要威胁,主要通过电磁辐射信号影响和破坏用户对有用信号的检测,从而使得系统性能严重下降。在军事无线通信领域,恶劣电磁环境条件下的通信抗干扰能力是决定现代战争胜负的重要因素,是军事无线通信装备最基本的要求,也是战场生存能力的重要特征[7]。在民用通信领域,基本的通信抗干扰能力也是用户适应复杂使用环境、提高信息传输可靠性的一种重要手段。随着人工智能与通信对抗的深度融合,电子进攻技术得到迅速发展,干扰样式不断增加,智能化水平不断提升,使得无线通信系统面临日益复杂和恶劣的电磁环境。此外,随着无线电新技术、新业务的广泛应用,无线业务需求日益增长,无线设备数量急剧增加,使得频谱资源显得非常紧缺,相应的互扰现象也变得异常严重。因此,未来的新型干扰环境将呈现出“干扰智能”“构成复杂”等典型特征。“干扰智能”是指干扰具有一定的智能性,它能够学习通信用户的传输策略,从而实施更有效的干扰。“构成复杂”是指除外部恶意干扰之外,还需要考虑用户间因使用相同信道而产生的同频互扰、带外域或杂散域无用发射造成的用户间互扰以及频谱泄露等因素[8-9]。对于通信用户间互扰问题,本书主要关注同频互扰,它是产生用户间互扰的主要来源。
传统的通信抗干扰技术主要有干扰躲避技术和干扰消除技术。干扰躲避技术是指利用躲避的方式应对干扰的攻击,如频域的跳频、时域的跳时等[7]。干扰消除技术是指利用信号处理的方式将接收信号中的干扰尽可能消除,如自适应滤波、干扰抵消技术等。然而,传统的通信抗干扰技术缺乏对干扰智能性的研究,并且在抗干扰决策方面智能性不足,在新型干扰环境中其性能难以保证。因此,在新型干扰环境中实现无线通信的可靠传输面临严峻挑战,亟需深入研究高效的无线通信抗干扰方法。随着认知无线电[10-12]以及人工智能技术[13-15]的飞速发展,通信抗干扰被赋予了新的内涵。一方面,干扰方可以利用这些新兴的无线通信技术产生更加复杂、有效的干扰样式[1620],干扰样式朝着高效化、智能化的方向发展,其干扰意图和干扰策略将根据通信行为的变化而动态调整,为实现高可靠通信带来巨大挑战;另一方面,这些新兴技术的发展也为提高无线通信系统的抗干扰能力提供了新的思路。为了提升无线通信系统的抗干扰能力,借鉴认知无线电以及人工智能技术的智能抗干扰将是抗干扰领域的发展趋势。此时,用户将具有干扰环境认知和自主决策能力,以“干扰环境认知—在线学习—自主决策”为核心的通信抗干扰新范式,将有效提升系统的抗干扰能力。它将通过准确地感知、分析、判断通信用户所处的电磁环境,智能地选择合适的通信抗干扰策略,如选择合适的通信信道、发送功率或跳频图案等。与认知无线电类似,可使用一个通信抗干扰环路来表示智能抗干扰的基本思想。如图1-1所示,通信抗干扰环路主要包括干扰认知、抗干扰智能决策以及多域波形重构等主要部分。
图1-1 通信抗干扰环路
1.干扰认知
在干扰认知阶段,为了获取有用信息,可以借鉴认知无线电相关技术。该阶段需要感知周围无线环境中的干扰活动。具体来讲,干扰认知主要包括干扰检测、干扰定位、干扰预测等内容。已有文献中有很多的干扰检测方法,如机器学习、压缩感知,以及基于估计的检测方法等[21-22]。干扰定位作为干扰认知的另一个重要内容,已有的干扰定位方法可大致分为测距相关方法(Range-based Methods)和测距无关方法(Range-free Methods)。其中,测距相关方法包括Pinpoint、WiSlow和CrowdLoc等方法;测距无关方法包括质心定位(Centroid Localization,CL)、双圆定位(Double Circle Localization,DCL)和三圆定位(Triple Circles Localization,TCL)等方法[22]。
2.抗干扰智能决策
基于干扰认知的结果,进行抗干扰智能决策,并获得最佳抗干扰策略(如通信信道、发射功率等)。抗干扰决策的主要挑战是在干扰环境条件下,尤其是在新型干扰环境中,如何有效地选择抗干扰策略。为了有效提升无线通信系统的抗干扰能力,已有文献给出了许多抗干扰决策方法,如基于博弈论(Game theory)[23-33]、多臂老虎机(Multi-armed Bandit,MAB)[34-36]以及强化学习(Reinforcement Learning,RL)[37]的抗干扰决策方法等。抗干扰智能决策作为整个抗干扰环路的核心环节,它以实时感知电磁环境为基础,以自主决策为核心,以系统多个参数的动态调整为手段,从而提升系统的抗干扰能力。
3.波形重构
为了实现抗干扰通信,波形重构可在多域(功率域、频域和空域等)实现,它是干扰环境中实现可靠传输的物理层手段。
本书重点针对通信抗干扰智能决策这一核心环节展开研究,它是无线通信抗干扰的关键问题之一。考虑到无线通信网络的不完全、不确定、动态性等固有特性[38],以及新型干扰环境中的密集、异构等特殊性,通信抗干扰智能决策面临如下难题和技术挑战。
(1)对抗性(Adversarial)。在抗干扰场景中,通信用户追求信息的可靠传输,而干扰故意恶化用户的通信。因此,用户和干扰是一种非合作关系,双方具有明显的对抗特性。不同于一般的无线通信系统,对抗性是通信抗干扰中的一个显著特征。
(2)不完全性(Incomplete)。由于通信用户和干扰之间的对抗特性,用户和干扰很难获取对方的完全信息,抗干扰决策过程中需要应对不完全信息约束。同时,考虑到硬件限制和资源的消耗,用户和干扰只能获得环境的部分信息。因此,干扰环境中需要考虑多种不完全性,如信道增益不完全[39]和用户类型不完全[40]等。
(3)不确定性(Uncertain)。在通常情况下,估计环境信息(如信道可用状态)开销巨大。同时,由于信号处理能力以及硬件限制,获得的信息常常存在一定的观测误差。因此,环境信息存在不确定性。
(4)动态性(Dynamic)。无线网络中的环境信息通常是动态变化的,如信道状态信息、业务需求等。在新型干扰环境条件下,干扰决策的智能性造成外部环境状态更难预测,干扰环境变得更加动态复杂。
(5)密集性(Dense)。当前的无线通信网络及用频设备的部署越来越密集。抗干扰需要同时应对用户间因用频冲突而产生的互扰和外部恶意干扰。外部恶意干扰是导致网络性能下降的一个关键因素,而用户间互扰是影响网络性能的另一个重要因素。此时,“内部冲突、外部对抗”问题突出,通信抗干扰需要同时考虑己方用频互扰和外部恶意干扰,这将导致抗干扰决策难度增加。
(6)异构性(Heterogeneous)。在未来的无线网络中,由于在一个区域部署了多种类型的无线设备(如通信设备、导航设备、雷达设备等),使得无线环境呈现出明显的多样性和密集性。此外,不同类型的无线业务(如数据、语音、图像等)具有不同的抗干扰需求。因此,研究异构无线网络中的抗干扰决策问题是一个极具挑战性的问题,需要综合应对系统内干扰、系统间干扰以及外部恶意干扰。
根据上述分析,面对具有“干扰智能”“构成复杂”等特征的新型干扰环境,抗干扰智能决策存在诸多技术难题和挑战。本书重点关注链路级通信抗干扰智能决策相关问题,即在干扰认知的基础上,自主选择合理的抗干扰策略(通信信道、发射功率等),从而提高通信用户在新型干扰环境中的抗干扰性能。