7.6 发展趋势
据国家信息中心发布的《2017中国大数据发展报告》显示,我国大数据发展总体处于起步阶段。其中,北京、广东、上海、江苏、浙江在我国地方大数据发展方面处于领先地位。大数据战略重点实验室发布的《大数据蓝皮书》指出了我国当前大数据发展的十大趋势,包括:从中央到地方,丰富细致的政策体系助推大数据落地;国家级“试验区”、部委级“产业示范基地”和省市级“示范园区”的大数据试点创新体系正在形成;市场对数据交易有着巨大的需求,有望出现规模超过万亿元的数据交易市场;数据权属的法律问题亟待破题,数据价值评估和交易规范机制待建立完善等。
2017中国大数据技术大会(BDTC)发布的《2018年大数据发展趋势预测》提出:机器学习继续成为大数据智能分析的核心技术;人工智能和脑科学相结合,成为大数据分析领域的热点;数据科学带动多学科融合;数据学科虽然兴起,但是学科突破进展缓慢;推动数据立法,重视个人数据隐私;大数据预测和决策支持仍然是应用的主要形式;数据的语义化和知识化是数据价值的基础问题;基于海量知识的智能是主流智能模式;大数据的安全持续令人担忧;基于知识图谱的大数据应用成为热门应用场景等。
除了以上学界认可的趋势,本章结合发展和应用现状,分析和总结了宏观方面的如下六大趋势。
1.大数据基础设施和生态系统日臻完善
经过数年的积累,中国大数据生态系统和产业链日趋成熟和稳定,焕发蓬勃生机。顶层设计不断加强,政策机制日益健全。随着信息化水平的不断提高,政府部门和各行各业积累了丰富的数据资源,智慧城市建设全面铺开,信息消费蓬勃发展,网民数量超过7亿人,居世界第一位。我国在软/硬件开发、平台建设、分布式计算架构、数据分析挖掘、语音图像识别、深度学习芯片等技术研发上不断抢占制高点。国家大数据综合试验区建设不断加快,区域聚集效应明显,重点区域产业布局有效推进,政府与企业联动的态势良好。大数据开放共享、交易流通逐步规范。大数据的新技术、新业态、新模式不断涌现,各领域对大数据服务的需求将进一步增强,产业规模将继续保持30%以上的高速增长态势。
2.大数据与行业应用、实体经济进一步深度融合
随着我国大数据基础设施、产业链条、生态系统和政策环境的不断完善,大数据经济形态将从以基础型和支撑型为主,逐渐过渡到融合型。数据分析挖掘和商业智能产品将逐渐成为大数据应用的主力军。大数据将逐渐走向各个行业,与行业发展深度融合,基于行业的大数据分析应用需求也日益增长。除了金融、政务、交通、医疗等领域的应用之外,农业、旅游、能源、制造业等也将有巨大的应用潜力。随着各行各业数字化和信息化的不断推进,得益于更多维度、更多途径的数据源,更优质的数据量,大数据应用场景的开发也将有更多空间,如智慧城市、智能制造、智慧农业等。
3.对大数据安全和隐私保护的需求进一步显现
大数据时代,大型互联网公司的数据垄断态势已逐步显现。2018年年初,全球最大的社交媒体Facebook被爆出非法收集用户数据,并在2014年泄露了数百万Facebook用户的数据。无独有偶,阿里巴巴“2017年支付宝年度账单”产品上线后,打开该账单第一屏后会默认勾选《芝麻服务协议》,涉及诱导性链接和用户隐私在不知情状态下被泄露。在2018年年初的一次访谈中,百度 CEO表示,中国用户愿意用隐私换效率,引起了广大网民的激励讨论。随着互联网、大数据技术与各行各业的进一步深度融合,广泛影响了人们的生产生活,个人的隐私和信息被企业获取后,聚集成海量数据,可以被用来做深度的数据分析,转而用于商业用途。在大数据时代,人们的信息和数据可以更加便利地被收集、聚合、分析和使用,也更容易被公开和泄露,每个人都相当于在“裸奔”。整个社会对大数据安全和隐私保护的需求和呼声在未来几年必将进一步提升。
4.人工智能的发展促进大数据的持续繁荣并带来挑战
2017年,人工智能、机器学习、深度学习等技术的快速发展,也促进了大数据和数据分析产品的新一轮进化。针对某一行业的智能产品和应用,如何在庞大的数据面前,用机器学习、深度学习的方法对数据进行建模、融合、分析、挖掘,进而转化为人工智能产品,这一点也是行业迈向智能化的必由之路和重要挑战。2018年,人工智能、深度学习技术将推动大数据分析和大数据服务继续向各个领域渗透,在医疗诊断、客服机器人、市场分析预测、陪护机器人、人脸识别、语音识别、辅助决策、个性化推荐等领域均将发挥重要作用。
5.区块链技术将优化大数据治理模式
作为比特币的底层实现技术,区块链成为近两年的技术热点。由于具有去中心化、分布式、不可篡改、加密存储、可追溯等众多优点,区块链被认为是一项具有颠覆性的技术。除了能在金融、征信、证券、跨境交易、物流等领域应用之外,在数据管理、数据确权、数据交易等大数据领域,区块链也能大有作为,通过区块链与大数据的结合,可以更好地做到数据溯源与确权,规范数据交易,保障数据相关方的权、责、利,防止数据被垄断和滥用,保护数据安全等。基于区块链技术的大数据治理,将是未来几年值得深入研究的问题和方向。
6.边缘计算技术发展将优化大数据基础设施
万物互联的时代,存储、计算都越来越依赖于云中心,云中心成为构筑信息社会的枢纽。如何传输和处理海量数据给云中心带来了巨大的压力和挑战。例如,很多应用需要在毫秒之间实时响应,如无人驾驶汽车。把所有的数据都放到云端存储和处理并不可取,因为云中心可能在几千公里之外,延时抖动和距离并不可控。在这种情况下,边缘计算近两年迅速兴起。边缘计算指在靠近物或数据源头的网络边缘侧,融合网络、计算、存储、应用核心能力的开放平台,就近提供边缘智能服务,满足行业数字化在业务实时、业务智能、数据聚合与互操作、安全与隐私保护等方面的关键需求。云计算适合非实时、长周期数据的大数据分析,而边缘计算则主要完成实时、短周期数据的分析,更适合本地业务的实时处理与执行。边缘计算处理简单的数据,云计算处理相对复杂的信息。未来,边缘计算将和云计算协同,共同优化大数据的存储和处理平台,从而提供更加高效的大数据基础设施。
(范灵俊、欧中洪、于培华)