现代卫生信息技术与应用
上QQ阅读APP看书,第一时间看更新

四、发展趋势

未来的大数据技术将呈现基于众包的数据生成与采集、以数据为中心的存储建模、智慧生成3大发展趋势。

(一)基于众包的数据生成与采集

在数据生成与采集层面,众包模式将成为趋势。众包概念由美国《连线》杂志记者Jeff Howe提出,是指一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)大众网络的模式。众包是一种分布式的问题解决和生产模式,是一种变革众多行业的商业模式或组织方式。如WAZE(众包位置数据服务)是众包模式地图应用的一家公司,聚集司机的力量,共享路况、事故、加油站等信息。
通过众包可重新建立产品或服务的生态环境,众包已经成为大数据产业的核心模式之一,贯穿在数据采集、开发、测试、服务的各个环节。目前成功的大数据系统,特别是面向大众消费者的大数据系统,普遍构建了一个类似于生态圈的环境,各个消费者角色在生态圈中通过简单的规则进行交互以达到自我目的,在消费数据的同时也在生成数据。携程、淘宝、QQ以及各类在线游戏系统都采取了众包模式。而没有采用众包模式的系统往往步履艰难。如传统的导航系统雇佣专人标定建筑物,不仅成本高、更新迟缓,而且准确率也低。而百度的导航系统依赖百度地图,使用者可以直接提交纠错信息,以弥补数据生成不足、准确性低的问题。“免费”的导航软件在非专有化的大众导航市场上已经占据了主导地位。

(二)以数据为中心的存储建模

在大数据存储层面,未来统一的数据中心将成为趋势。电子商务、游戏等大众消费类系统数据适合统一存储和建模。但企业、政府、行业类大数据系统已有众多系统在线运行,若强行统一数据存储与建模则不具备可行性。因此新建的大数据系统需通过企业服务总线模式,与原有在线生产系统对接,通过已有的系统进行数据采集,经过转换与建模后进行统一存储,以达到数据共享、互通的目的。

(三)智慧生成

在数据分析挖掘层面,未来的大数据系统能否生成智慧、替代人类专家,是区分大数据系统与传统IT系统的关键特征。无论数据量有多大,无法生成智慧的系统也只是一个大型的传统系统,而不是大数据系统。
智慧是信息层次模型的最高层次,由知识和经验累加构成。智慧生成模型如图1-3-1所示。各个行业的智慧发现都依赖各行业的专家,一个专家的能力与他在行业内的经验积累(知识库)密切相关,其所沉淀积累的知识越多,则做出正确抉择(智慧)的可能性越大。但人类专家的工作效率和准确性均有限。特别是在经验或数据缺乏情况下,专家们往往依靠直觉做判断,加剧了结果的不准确性。
图1-3-1 智慧生成模型
在大数据诞生以前,智慧很难通过机器生成。通过大数据挖掘手段,可以依托海量的知识库,将输入的知识(或信息)转化为智慧。未来传统的行业专家很可能会被具备行业知识的大数据专家所替代。机器通过挖掘大数据,发现知识并输出智慧,再由人类专家对结果进行检验与校正,通过机器学习,逐步提高结果的准确率。未来随着数据量的增大、挖掘算法的改进以及计算能力的提升,大数据系统将可以做出超越人类专家经验与直觉的智慧建议,从而在各个行业大幅度地提升人类活动的准确性,提升整个社会的生产力。