序一
Preface One
这是一个数据爆发的时代,宽带化、移动互联网、物联网、智能终端的普及与人工智能的兴起,促使全球数据每两年翻一番,预计2020年全球数据规模将达到44ZB,较2013年将增长10倍。有资料报告,2013年全球数据的来源基本上是消费者、企业与政府各贡献1/3。按照用户数计算,在中国,无论是互联网用户还是移动互联网用户,无论是固网宽带用户还是移动宽带用户,其规模都已经是全球第一,中国的数据拥有量的潜力为全球之冠。IDC公司曾经指出,2013年中国在全球数据占比13%,预计2020年将上升到18%。
拥有数据并不意味着坐拥金矿,数据的产生与存储还要付出成本代价,大数据只有通过数据分析与挖掘,发现知识和生成智慧才能创造价值。大数据挖掘的应用将总结事物发展规律,提升人类生产与管理活动的准确性,减少传统方式下的“试错”成本,进而提升社会的总生产效率。
大数据的挖掘需要很多技术支持,反过来说也带动了海量存储、高效计算、深度学习、可视呈现等很多技术和学科的发展,它是当代信息技术的集中体现。大数据挖掘本身是产业,但其效益更多地反映在其应用到的社会管理和其他行业中,大数据之所以受重视正是因为其溢出效益明显,大数据将成为影响国家竞争力的重要因素。
美国、英国、欧盟、日本和韩国等国政府越来越重视大数据所产生的价值,鼓励使用大数据以推动社会进步,支持政府数据的公共资源化,并发布促进大数据技术发展的政策纲要。2015年中国国务院发布《促进大数据发展行动纲要》,提出了五大目标、三大任务、十大工程以及七项政策,在国家层面推动大数据的应用与落地。大数据的挖掘应用正在引起各行各业的关注,成为“互联网+”行动的主要抓手,将发掘经济增长新动能。
大数据的挖掘不仅需要技术,更需要人才,麦肯锡公司预测,到2018年美国对大数据深度分析人才的需求与实际可供给之间相差一倍以上。我国与发达国家相比更缺乏深度分析人才,尤其是大数据架构师。高校承担了培养人才的责任,但更需在实践中锻炼,为加速大数据架构师的成长过程,实用经验的传承十分重要。
中兴通讯对大数据的知识与工程经验进行系统性的概述,正好契合了当前大数据挖掘应用的浪潮,弥补了此类书籍的空白,为促进大数据技术的发展与应用提供了宝贵的经验。
中国工程院院士
中国互联网协会理事长