第1章 分层算力网络——物联网数据经济趋势的必然
随着技术和经济的进步,计算硬件成本显著降低,终端设备与无线通信技术得到了快速发展,大量的传感器被集成到各种硬件设备中,进而催生了物联网产业。物联网旨在建立一个物物相连的互联网,其理想化目标是任何人在任何地点都可以与任何人或物体通过网络连接,并且能够自由地使用任何网络、享受任何服务。物联网中广泛部署的传感器可以对环境、人、物体等进行数据采集,然后将采集的数据进一步分析整理来获得有价值的信息,以帮助客户快速做出决策。随着物联网的迅速发展,以及人均移动设备(例如移动电话和平板电脑)数量的激增,联网设备数量大幅增加。遍布各处的物联网终端很快就会超越目前网络中的设备总量。近期迅速增加的物联网终端包括可穿戴计算设备(智能手表、眼镜等)、智慧城市、能源供应商在用户家中部署的智能计量设备、自动驾驶车辆、传感器等。物联网应用程序的发展也推动了手机等个人智能终端连接到物联网中的进程。高德纳(Gartner)、思科(Cisco)等多家公司曾预测到2020年全球将有500亿个终端设备连接到物联网。
众所周知,数据是数据经济中最关键的因素,通过对大量数据的分析,用户能够获得对自身、自身的行为与周边环境等方面更为详尽的了解。在移动互联网普及的时代,大型科技企业,如谷歌(Google)、微软(Microsoft)、亚马逊(Amazon)、百度、阿里巴巴、腾讯、京东等每天都会生成海量的数据,其中蕴含着巨大的价值。物联网中广泛分布的大量终端将带来海量的实时数据,而数据和基于数据的应用,也是物联网的核心价值所在。目前许多行业都在尝试解决海量数据处理(又称为“大数据”)的新挑战。通常情况下,能够称为“大数据”,至少需要满足以下3项特征中的1项。
1.数据量大。如数据量级达到太字节(TB)、拍字节(PB)、艾字节(EB)等。
2.数据来源广泛且多样性高。指数据的类型丰富。数据可以由不同的来源产生,例如传感器、计算机网络、社交网络和手机等。因此,数据可以是网络日志、RFID传感器读数、非结构化社交网络数据、流式视频和音频等。
3.数据产生速度快。指的是数据产生的频率高。通常,可以将该速度定义为3个类别:偶尔、频繁和实时。
无疑,物联网产生的数据符合大数据特征。除此之外,物联网中的应用多种多样,某些应用所需的数据数量大,种类繁多,复杂性高。为了能够及时处理此类数据,还需要设计一个专门针对物联网数据处理的模型。该模型需要满足的要求包括低延迟、高可伸缩性、保证数据安全与隐私、高可靠性、可适应广泛地理区域的不同环境条件等,每种要求的简介如下。
1.低延迟。物联网传感器本身的计算能力一般受限于其体积或电池容量,因此往往无法满足相关应用的数据处理需求。海量的物联网传感数据必须传输到计算能力更强的设备中进行处理。大量数据的传输,尤其是包含多媒体数据的传输,对网络带宽的要求非常高,而且数据传输的用时也较长。再者,物联网中有大量对时间要求较高的业务,例如无人车实时导航等控制响应类业务。此外,还需要尽可能避免由多层转发带来的较高通信中继时延。因此,需要合理配置计算资源以降低延迟,甚至达到实时响应的要求。
2.高可伸缩性。物联网中各类应用种类繁多,不同业务的数据采集时间需要依据其业务特性与终端资源来规划。因此,难以通过统一调度来使数据处理需求在不同时段均匀分布。面对海量数据的处理请求,物联网数据处理系统需要有按需扩展的能力,一方面要避免空闲时期的资源浪费,另一方面要快速应对数据高峰时期的处理需求。
3.数据安全与隐私。物联网中包含大量关键数据及个人隐私数据,这些数据的泄露将给用户甚至垂直行业带来无法估量的损失。因此,数据在传输和存储时均需要受到保护。
4.运行可靠性。物联网在关系公民安全的场景和关键基础设施中的应用日益增多。系统错误将导致其关联业务无法顺利实施。因此,需要保障物联网数据处理系统的可靠运行。
5.适应广泛地理区域的不同环境条件。物联网设备可能分布在数千平方千米以上范围中的不同地点。其部署位置包括道路、铁路、变电站和车辆等较为恶劣的环境,以及较为偏远或孤立的地区,如沙漠、油田、海上运输轮船和商业飞机等。因此,该模型需要能够实现在不同环境条件的广泛地理区域收集和处理数据。