上QQ阅读APP看书,第一时间看更新
2.2.4 自治域、自闭环
从上述边缘计算面临的挑战来看,不论是资源有限的约束、网络连接的潜在不可靠,还是极简运维的要求,都要求边缘计算框架应在本地实现自治域与自闭环能力,即需要边缘计算节点在暂时无法与互联网连接,也就是在与云数据中心隔离的情况下仍能正常工作。也就是说,网络中断不应影响边缘计算节点相关服务的正常提供。边缘计算应形成一个自治域(可能是一个集群,也可能是周边区域中的多台设备),能针对周边环境的变化、网络配置的原始意图和可调度资源的运行状态,自主采取不同的针对性措施并自行实施,包括动态资源分配的调整、故障节点的隔离、不同业务质量的动态调整等。在与互联网恢复通信后,边缘计算节点还应自动将相关变化信息同步至云计算中心,获取刷新的策略与意图。上述过程在边缘计算节点的生命周期中不断循环。
要实现边缘计算领域的自治域与自闭环,需要满足如下条件:
□ 需要对来自不同厂商的、异构的(如有)基础设施实现规格化、资源池化的管理与调度。不同的应用场景,对基础设施的要求也不相同。为提高应用部署效率,需统一基础设施部署的规格。规格化定义可从部署安装环境、I/O及加速部件可扩展性、高温/高湿环境适应性、故障管理和设备易维护等几个方面来定义。规格化定义有助于从设备供应、安装部署、运营维护和故障恢复等方面形成一系列产业建议,促进生产链成熟。
□ 自治域需要具备环境感知能力,即要能感知外部的环境变化,比如业务流量的变化、用户数的变化、部件出现故障(含器件和网络的故障)等。
□ 需要基于网络意图或策略进行描述与执行,包括对不同意图或策略的优先级判定,在外部环境变化时,选择最优的执行策略。