1.3 研究挑战与进展
人机物融合群智计算为未来智能计算系统的发展带来了大量机遇,但实现真正人机物和谐融合的智能感知计算空间还面临很多挑战。下面将分别从人机物群智协同机理、自组织与自适应能力、群智能体分布式学习等新的理论、模型和方法探索方面来阐述。
1.3.1 人机物群智协同机理
既有群体智能研究多面向单一群体间的协作,人机物融合群智计算则涉及异构智能体间的协作增强,故需要在理论和模型层面开展新的探索。
·自然集群协同机理发掘:自然界生物集群协作机制为研究具有自适应、自组织、持续演化能力的人机物融合系统提供了重要依据[13-14]。需探索生物集群协同机理与异构群智能体间高效协作的隐含关联和物理映射机制,发掘人机物高效协同机理,例如研究蚂蚁、蜜蜂、鸟、鱼等生物群体的形成和演化机制、集体行为机制、自组织和自适应方式、群体决策模式等。
·群智能体高效协作机制:针对人、机、物、环境等异构要素的有机组织协调问题,如何借鉴生物界中的各种合作模式和组织形式[15]实现异构群智能体之间的高效协作也是一个重要挑战。
·异构群智能体统一表示模型:针对人机物各要素的表达异构、能力不同、知识碎片化等问题,如何构建统一的异构群智能体表示模型,对各要素关联、组织模式、行为决策、知识表示等进行结构化表征是人机物融合群智计算的一个基础性问题。
针对以上挑战问题,在如何结合生物群智协作机理进行人工群智能体系统研究方面已经有一些探索性研究。生物体以简单的方式与群体中的相邻个体以及周边环境进行接触,以一种无中心的方式通过分布式协作来完成复杂任务;但作为一个群体,它们能够出于繁殖的目的建造出最复杂的巢穴[14],会在寻找食物过程中给同伴释放信息素以留下踪迹,成千上万只鸟列队飞行却能以令人难以置信的精度实现群体快速转弯[13]。集群机器人(Swarm Robotics)是一种通过模拟多样化的生物群体行为而发展起来的人工群智系统。例如,哈佛大学研究人员通过模拟白蚁种群行为来构建人工多智能体建造系统,在建筑机器人之间引入简单的局部规则来构建复杂的建筑结构[14]。麻省理工学院的Li Shuguang等人研发了一种能模拟生物细胞集体迁移的机器人,利用信息交换、力学协同等生物细胞学现象实现移动、搬运物体及向光刺激移动等复杂行为,该研究为开发具有预先确定性行为的大规模群体机器人系统提供了新途径[11]。加州大学的研究人员[16]结合强化学习研究了自然系统与人工系统间的互相借鉴和促进作用,一方面强化学习方法的成功源于对生物界学习行为的有效模拟,另一方面对深度强化学习的探索和实践反过来也促进了对于生物学习行为的理解;而基于彼此的相互借鉴则提出了一些新的学习模型,如元强化学习[17]或分层深度强化学习[18]等。
1.3.2 自组织与自适应能力
人机物融合群智计算需要根据环境的多变性、人机物节点能力的差异性以及群智能体连接拓扑的动态性等,自适应地组织各要素以适应动态的环境及应用场景,最终达到提高协作效率和质量的目的。具体来说,面临如下研究挑战。
·人机物多维情境识别:为实现异构群智能体的有效组织和协作,需要首先对智能体个体和群体的多侧面动态情境进行准确识别和预测,如能量状态、计算能力、通信带宽、关系拓扑、可信任度等,进而为任务关联的人机物自组织机制提供支撑。
·群智能体自组织协作计算:针对单智能体计算资源不足的问题,由周边共存的多个移动设备、可穿戴设备或边缘设备等组成动态协作群。研究群智能体自组织协作高效计算模式,能根据性能需求(如时延、精度)和运行环境(如网络传输、能耗情况等),将原始任务进行自动“切分”并优选和调度合适的智能体协同完成感知计算任务。
·跨空间协作感知计算:根据特定感知任务(如公共安全事件监测),研究如何快速发现不同空间高度关联的群组(群智感知参与者、移动互联网应用、城市物联网感知设施)并进行协作组队,进而探索情境自适应的群组动态协同及演进策略。
针对情境自适应组织协作问题,已经有一些前瞻性研究。在多智能体协作计算方面,边缘智能(Edge Intelligence)[19]使得资源受限的终端设备通过“多设备协同”或者“边-端协同”等方式实现资源需求较大的深度学习模型的有效分割与分布式运行,如密歇根大学提出的NeuroSurgeon模型[20]。生物系统的自适应、自组织机制也为研究人工群智系统提供了重要依据。例如Antoine Cully[21]从动物自适应机理研究中得到启发,提出了一种智能试错算法使得在异常情况下能在短时间内找到自适应方案。哈佛大学的研究人员[22]从微观多细胞组织和复杂动物组织结构(鸟群、鱼群)中得到启发,通过能力有限的个体机器人Kilobot,设计有效的分布式交互机制,实现了大规模机器人情况下鲁棒的自组织协作行为,包括集聚、成型、动态变换等。
1.3.3 群智能体分布式学习
针对单智能体数据和经验有限、模型训练能力弱、应用场景和任务多变等问题,与现有集中式学习模型和框架相区别,如何在群体分布式环境下实现人机物群智能体的增强学习是人机物融合群智计算一个新的挑战。
·群体分布式学习模型:需基于生物群体交互式学习机理,探索融合协作、博弈、竞争、对抗等特征的群智能体分布式学习模型。此外还要探索单智能体数据有限且隐私要求高情况下的可信群智学习方法。
·群智能体知识迁移:各智能体由于知识经验和数据分布不均,且在面对新个体、新任务、新场景时存在冷启动或小样本问题,需探索跨实体、跨任务的群智能体知识迁移方法,将多个“富经验”智能体知识迁移给新的实体或任务,实现智能体的持续学习和演化。
·人机物协同增强学习:人类与机器的学习和计算能力存在互补性和差异性,需研究人在回路、群智融合、人机协同方面的学习模型和范式,从协作模式、协作时机、负担最小化等方面研究人机物协同增强学习方法。
针对群智能体分布式增强学习问题,近期有一些相关的研究进展,如元学习、联邦学习、多智能体深度强化学习等。元学习[23]通过融合多个“富经验”智能体的训练模型来指导新的或缺少知识的智能体快速学习和成长,实现群智能体间知识的迁移和共享。联邦学习的思想由谷歌最先提出[24],它基于分布在多个设备上的数据集构建机器学习模型,在保障数据交换隐私安全的前提下,通过多设备协作开展高效率学习实现群体增强。多智能体深度强化学习利用智能体间的协作和博弈激发新的智能,例如Google DeepMind在《科学》杂志上发表的论文[25]中通过智能体在多玩家电子游戏中掌握策略、理解战术以及进行团队协作,展示了智能体在强化学习领域的最新进展。