九、智能城市信息环境建设与大数据应用面临的挑战
(一)信息环境一体化建设与碎片化角力的挑战
未来智能城市的信息社会必将是人与物高度互联、信息高度发达的社会,打造一体化的智能城市信息环境是发展智能城市的重要的基础性工作。智能城市信息环境的显著特征是信息密集、处理复杂。面对如潮水般涌来的“信息洪流”,如何从纷繁复杂的信息大数据海洋中分离出有用的信息为城市管理决策服务,为老百姓生产和生活服务,便成了一项非常复杂、艰巨的工作。因此,未来智能城市的信息环境是一体化的生态系统,各类信息系统之间是没有“围墙”的。只有这样,才能及时、快捷地应对智能城市信息的洪流,才能服务城市各类人群的各种需求。
但是,在建设智能城市的过程中,由于技术、观念及利益驱动不同,现在智能城市信息环境建设还没有上升到一体化生态系统建设的高度。人们还是习惯先建立各个信息系统,应对眼前的各类智能应用需求,形成各类信息孤岛或信息烟囱。在国家相关部门推进智能城市建设的过程中,我们所见到的示范项目都是这样的建设模式。因此,目前的信息环境必然是碎片化的,不能形成一个完整的信息生态系统。但是这个过程也是必需的,因为目前的技术和观念还需要进一步发展和转变,这是一个必然的渐进的过程,很可能是一个比较长期的过程。因此,在可以预见的将来,在智能城市信息环境建设的过程中,这种信息化环境一体化建设与碎片化建设的角力过程还将持续下去。
(二)大数据应用为城市信息环境建设带来的技术挑战
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键在于提高对数据的“加工能力”,通过加工实现数据的增值。对于“大数据”,高德纳(Gartner)咨询公司给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。也就是说,大数据只有变成可用的知识,才能真正发挥其价值。
随着智能感知、移动互联、社交网络、电子商务等广泛应用,各种数据正在迅速膨胀。互联网(社交、搜索、电商)、移动互联网(微博、微信)、物联网(传感器)、车联网、GPS、医学影像、安全监控、金融(银行、股市、保险)、电信(通话、短信)等等都在疯狂产生着数据。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者载体。若全球每秒钟发送290万封电子邮件、一分钟读一封,足够让一个人昼夜不息地读5.5年;若每天有2.88万个小时的视频上传到网上,足够让一个人昼夜不息地观看3.3年……
这些大数据同过去的海量数据有所区别,其基本特征可以用4个V来总结(volume、variety、value和velocity),即体量大、多样性、价值密度低、速度快。①数据体量巨大,从TB级别跃升到PB级别。②数据类型繁多,如交易信息、网络日志、视频、图片、地理位置信息等。③价值密度低,以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。④处理速度快。
大数据技术是指从各种类型的巨量数据中快速获得有价值的信息的技术。目前所说的“大数据”不仅指数据本身的规模,也包括采集数据的工具、平台和数据分析系统。大数据研发目的是发展大数据技术并将其应用到相关领域。因此,大数据时代带来的挑战不仅体现在如何处理巨量数据并从中获取有价值的信息,也体现在如何加强大数据技术研发(包括做好大数据基础设施的建设)以抢占时代发展的前沿。
管理大数据易,理解大数据难,真正的问题在于挖掘大数据的价值,让大数据真正有意义。目前大数据管理多从架构和并行等方面考虑,解决高并发数据存取的性能要求及数据存储的横向扩展,但对非结构化数据的内容理解缺乏实质性的突破和进展,这是实现大数据资源化、知识化、智能化的核心。
当今大数据的运用仍面临多种技术难关,主要有:大数据的去冗降噪技术,大数据的新型表示方法,高效率低成本的大数据存储,大数据的有效融合,非结构化和半结构化数据的高效处理,适合不同行业的大数据挖掘分析工具和开发环境,大幅度降低数据处理、存储和通信能耗的新技术。有些行业的数据涉及上百个参数,其复杂性不仅体现在数据样本本身,更体现在多源异构、多实体和多空间之间的交互动态性。而当前技术尚且难以用传统的方法描述与度量,处理的复杂度很大。
(三)智能城市信息环境与大数据安全面临的挑战
随着智能城市的深入推进以及信息技术的快速发展,随之而来的就是城市信息环境的信息安全面临着更严峻的形势。人们对网络环境的要求越来越高,对网络安全也越来越重视。无论是网上交易,还是网络信息的传递,都对网络安全提出很大的挑战。现在网络信息安全已经成为国防安全和国民经济的重要组成部分。城市中任何一个已经在线运行的信息化业务系统的瘫痪都将极大地影响城市的运行状态,给政府管理城市带来极大的隐患。现在如果城市的整个信息网络瘫痪了,其效果不亚于一场较大的自然灾害。因此,在智能城市信息环境推进的过程中,我们必须认清城市信息网络环境的脆弱性和潜在的威胁。所以,采取强力的安全措施是必要的,这对保证网络信息的安全传递十分重要。而目前并没有任何的计算机技术能完全保证网络信息的安全性,所以我们除了要加强技术方面的发展,还必须考虑非技术方面的因素,如人们的安全意识等。
(1)需要法律法规的保障。法律是网络安全的第一道防线,可以说,完备的信息安全法律法规是有效保障信息安全的重要措施。目前,国家先后出台了《中华人民共和国信息安全条例》《中华人民共和国计算机信息系统安全保护条例》等一系列的法律,先后从不同的角度制定了计算机安全网络信息安全的法律法规,通过信息立法有效防范和及时处理信息犯罪问题,使信息安全越来越有保障。但是不容忽视的是,所谓“道高一尺,魔高一丈”,这样的博弈过程在智能城市信息环境建设与管理的过程中将会一直持续下去,因此,保障城市信息环境安全的法律建设也应当不断地深入下去。
(2)需要相关政策的保障。保障网络信息安全的政策需求是多方面的、多层次的,因而需要不断地制定出科学合理的信息安全政策,以指导信息安全方面的行政管理指导信息安全立法与司法,促进信息安全技术措施的制定与实施。
(3)需要管理机制的保障。组织机构建设是管理机制的核心。组织机构是指有关信息安全管理机构的建设。信息环境安全的管理包括安全规划、风险管理,应急计划、安全教育培训,安全系统的评估,安全认证等多方面的内容,因此只有靠完善的信息安全管理机构才能设法解决这些问题。此外,信息环境安全管理还需要高技术、高素质的管理队伍。特别是对于网络的管理者们来说,加强职业道德和基本社会公德的修养是十分必要的。要在源头上杜绝网络信息的不安全因素,这是这些管理者们责无旁贷的重任。
在智能城市大数据方面,大家都知道大数据具有巨大的潜力和价值,然而大量事实表明,大数据的不妥善处理会对用户的隐私造成极大侵害。人们面临的威胁不仅限于个人隐私泄露,基于大数据,人们的状态行为可能被预测到。
大数据系统收集海量的未分类、未经分析的数据,这些数据没有得到像传统数据库对数据部署那样的保护(如加密),可以被伪造。错误的数据往往导致错误的结论,数据在传播过程中逐步失真。密码学中的数字签名、消息鉴别码等技术可以用于验证数据的完整性,但是应用于验证大数据的真实性时就面临很大的困难,这是数据粒度的差异造成的。因此,虚假或错误的数据可能导致安全灾难。2013年4月,一家新闻机构的社交账号被黑客攻击,该黑客发出了虚假消息,声称白宫正受到攻击。这则消息导致几家投资机构开始抛售股票,最终让这些公司蒙受巨大的财产损失。智能城市大数据的涉密、隐私等问题如果处理不好,会给社会带来极大的困扰,也会影响智能城市的整个推进进程。
此外,大数据访问控制的难点在于:难以预设角色、实现角色划分,难以预知每个角色的实际权限。也就是说,对于大数据的安全,有时候防不胜防。因此,需要像重视信息环境安全一样高度重视智能城市大数据安全。
(四)大数据应用对现有观念及政策法规的挑战
已有研究表明,我国在数据资源的开放性、流动性、交互性上还远远不足。丰富的高质量数据资源是大数据产业发展的前提。近几年在互联网产业及金融、电信信息化快速发展的带动下,我国数据资源总量有了快速增长,但其他行业受信息化水平制约,数据储量仍不丰富。已有数据资源还存在标准化、准确性、完整性低、利用价值不高的情况。同时,我国政府、企业和行业信息化系统建设受到各种因素制约,形成了众多“信息孤岛”,数据开放程度严重滞后。因此,建立良性发展的数据资源储备与共享体系,是我国城市大数据发展的首要问题。智能城市应加快推动数据资源的开放与共享,明确开放共享的内容范围和相关标准,使数字资源实现社会价值的最大化,同时搭建数据共享平台。数据只有不断流动和充分共享,才有生命力,才能促进大数据成果的广泛应用。
此外,大数据相关的法律法规有待完善。我国个人信息保护、数据跨境流动等方面的法律法规尚不健全,这成为制约大数据产业健康发展的重要原因之一。随着大数据挖掘分析越来越精准、应用领域不断扩展,个人隐私保护和数据安全变得非常紧迫。当前无论是电商企业还是信息资源开发利用企业,在利用各类大型数据时处于一种灰色状态,对大数据应用还缺少规范的引导以及制度的建设。
在隐私保护方面,现有的法律体系面临着两个方面的挑战:①法律保护的个人隐私主要体现为“个人可识别信息”(personally identifiable information, PII),但随着技术的推进,非PII的数据也可能会转化PII,使得保护范围变得模糊。②以往建立在“目的明确、事先同意、使用限制”等原则之上的个人信息保护制度,在大数据场景下变得越来越难以操作。
因此,加强对数据安全保障的研究,制定国家数据安全及网络用户隐私保护标准和法律,才能为大数据技术的进步和大数据应用的发展保驾护航。我国需要及时制定大数据技术标准和运营标准,并尽快制定关于数据主权划分、数据安全和个人隐私保护的法律,为大数据产业发展创造健康的环境。