读懂新基建:数字技术带来全民机遇
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第二节 数据开放与数据资源共享

大数据的爆炸性增长

大数据指由数量巨大、结构复杂、类型众多的数据构成的数据集合,所涉及的信息资料库规模巨大,无法在合理的时间内通过传统的软件工具实现撷取、管理、处理并整理为可帮助组织进行决策的信息。

大数据系统有4个特性:数据量大、数据种类多样、实时性强、蕴藏的商业价值大。特别是随着物联网的发展,越来越多的传感器被部署在城市、服务业、金融业、工业、农业、能源等领域,借助条形码、二维码、RFID等可唯一标识产品,传感器、可穿戴设备、智能硬件、视频采集等源源不断地产生着海量数据,相关领域的数据规模已经达到TB级甚至PB级。有统计表明,2013年中国产生的数据总量是2012年的2倍,相当于2009年全球的数据总量。

市场调查公司IDC与企业存储技术公司EMC在2014年联合发布了第七次《数字宇宙报告》,该报告自2005年开始推出。2014年,IDC预计到2020年,数字宇宙(指由全球所有消费者和企业所创建的数据,包括视频、音频和文件等)规模将达到44 ZB。数字宇宙的规模在2005年仅为132 EB,2010年为0.8 ZB,2013年为2.8 ZB,数字宇宙从2013年开始每两年翻一番,而数字宇宙膨胀的主要原因是机器生成数据量的增长。这些机器包括智能手机、智能家电、智能工业仪表等嵌有传感芯片的机器,每一次鼠标点击、每一次点按触屏,都会留下一个或一组数字,这些数字都被保存和记录下来。

2019年3月,希捷公司与IDC共同发布了《IDC:2025年中国将拥有全球最大的数据圈》白皮书。根据该白皮书,全球数据圈将从2018年的33 ZB增至2025年的175 ZB;中国数据圈的增长速度最快,到2025年,预计中国将以48.6 ZB的数据量成为全球最大的数据圈。

推进数据开放与共享

互联网公司是天生的大数据公司,在搜索、社交、媒体、交易等各自核心业务领域积累并持续产生海量数据。物联网设备每时每刻都在采集数据,设备数量和数据量都与日俱增。除这两大数据源外,政府是全社会最重要的数据源。

《大数据产业发展规划(2016—2020年)》指出:“十二五”期间,我国政务信息化水平不断提升,全国面向公众的政府网站达8.4万个;近300个城市进行了智慧城市试点;信息消费蓬勃发展,网民数量超过7亿人,移动电话用户规模已经突破13亿人,均居世界第一;月度户均移动互联网接入流量达835 MB;政府部门、互联网企业、大型集团企业积累沉淀了大量的数据资源,我国已成为产生和积累数据量最大、数据类型最丰富的国家之一。当然,我国大数据产业具备了良好基础,面临难得的发展机遇,但仍然存在一些困难和问题,包括数据资源开放共享程度低、数据质量不高、数据资源流通不畅、管理能力弱、数据价值难以被有效挖掘利用。

国务院于2015年发布的《促进大数据发展行动纲要》把公共数据互联开放共享作为努力方向,包括在2017年年底前形成跨部门数据资源共享共用格局,在2018年年底前建成国家政府数据统一开放平台。《促进大数据发展行动纲要》还提出了“十大工程”:政府数据资源共享开放工程、国家大数据资源统筹发展工程、政府治理大数据工程、公共服务大数据工程、工业和新兴产业大数据工程、现代农业大数据工程、万众创新大数据工程、大数据关键技术及产品研发与产业化工程、大数据产业支撑能力提升工程、网络和大数据安全保障工程,其中七大工程都与数据开放有关。2016年1月7日,国家发改委下发了《关于组织实施促进大数据发展重大工程的通知》。

2016年,国家加大了对大数据应用的推动力度,批复了京津冀等7个国家级大数据综合试验区和超过10个大数据国家工程实验室;同时,针对医疗、交通等行业,有关部门均出台了关于大数据发展的指导意见,推动大数据在各垂直领域的应用进程。根据中国大数据产业生态联盟发布的《中国大数据产业生态地图白皮书》(2017年),截至2017年6月,全国多个省、市相继成立了大数据管理和服务机构,统筹决策领导大数据的管理和服务力度,如辽宁的沈阳市大数据管理局、浙江的宁波市大数据发展管理局和杭州市数据资源管理局、贵州的贵州省大数据发展管理局、广东的广东省大数据管理局、甘肃的兰州市大数据管理局等。

政府和城市数据大开放

2020年7月,复旦大学与国家信息中心数字中国研究院联合发布了“2020中国开放数林指数”和《2020中国地方政府数据开放报告》。“中国开放数林指数”和《中国地方政府数据开放报告》是我国首个专注于评估政府数据开放水平的专业指数和报告,由复旦大学数字与移动治理实验室制作出品,由复旦大学和国家信息中心数字中国研究院联合发布。“开放数林”意喻我国政府数据开放利用的生态体系,自2017年5月首次发布以来,中国开放数林指数每隔半年对我国地方政府数据开放水平进行综合评价,到2020年已连续第四年发布。

《2017中国地方政府数据开放报告》统计显示,截至2017年4月,以2015年8月底国务院印发《促进大数据发展行动纲要》为分水岭,在此之前各地数据开放平台增长较为缓慢,上海和北京最早进行了探索,此后无锡、佛山南海、湛江、武汉等地先后上线;《促进大数据发展行动纲要》出台后,各地平台增长速度明显提升。

截至2020年4月底,我国已有130个省级、副省级和地级政府上线了数据开放平台,其中省级平台17个,副省级和地级平台113个;我国54.83%的省级行政区(不包括港澳台)、73.33%的副省级行政区和32.08%的地级行政区已推出了政府数据开放平台。从2017年的20个,到2018年的56个,到2019年的102个,再到2020上半年的130个,政府数据开放平台日渐成为地方数字政府建设和公共数据治理的标配,“开放数据,蔚然成林”的愿景已初步实现。

在2020省级排名中,浙江和上海的综合表现最优,获得省级“数开繁盛”大奖,紧随其后的是山东、广东、贵州和北京,分别获得省级“数开成荫”奖和“数开丛生”奖;深圳和贵阳则获得地级(含副省级)“数开繁盛”大奖,之后是宁波、烟台、济南、福州和成都,分别获得地级(含副省级)“数开成荫”奖和“数开丛生”奖。这些地方都为全国“开放数林”树立了新的标杆。

在城市数据开放方面,在2020世界人工智能大会云端峰会·国际智能城市峰会上,上海社会科学院信息研究所正式发布《2020全球重要城市开放数据指数》。根据该指数排名,上海、纽约、首尔、北京、芝加哥、贵阳、深圳、广州、洛杉矶和巴黎位列前10。除首尔和巴黎外,排名前10的城市全部被中国和美国城市占据。说明继美、英之后,中国城市已经跻身全球城市数据开放领导者地位。上海的综合指数(百分制)高出第二名的纽约近30分,其他城市之间的分数相差只有个位数,说明上海数据开放水平远高于其他全球城市。

大数据交易促进数据流通

大数据交易是一种促进数据资源流通的创新方式,一批政府主导的大数据交易平台也成为我国大数据服务应用的新热点,如青岛大数据交易中心、江苏大数据交易中心、上海数据交易中心、杭州钱塘大数据交易中心、广州数据交易服务中心、贵阳大数据交易所、河北大数据交易中心、武汉东湖大数据交易中心等,交易产品包括数据包、API和数据分析报告等。在我国的大数据交易平台中,政府主导的大数据交易平台占14.29%,企业主导的大数据交易平台占82.86%。

截至2020年,国内现有的数据交易平台主要有三种类型:一是以贵阳大数据交易所为代表的交易所平台,包括湖北长江大数据交易所、陕西西咸新区大数据交易所等;二是产业联盟性质的交易平台,以中关村数海大数据交易平台为主;三是专注于互联网综合数据交易和服务的平台,比如数据堂等。

在《关于推进公共信息资源开放的若干意见》《政务信息系统整合共享实施方案》等文件的推动下,我国加快了政府数据共享开放的步伐。除中央政府主导的大数据资源有序开放外,各地方政府也纷纷制定了自己的大数据产业发展规划和大数据资源开放计划,各行业主机机构、产业联盟等也纷纷制定了本行业和联盟下属企业的大数据发展、开放、合作计划等。尽管政府和公共大数据的开放共享还处于起步状态,但可以说大数据资源正在继石油之后,成为可规模化经济的战略性资源。