第三次人工智能浪潮的颠覆性和局限性
进入21世纪以来,全球依次经历了信息化时代、大数据时代,目前正过渡到智能化时代。以深度学习为代表的人工智能技术,正加速与交通、医疗、教育、安防、农业等传统行业融合,给人类生产生活的各方面带来变革。作为一种颠覆性技术,人工智能的广泛应用将对现有社会体系产生深刻的影响:一方面,人工智能将推动生产力迅速提升,为人类探索未知世界提供无限可能;另一方面,人工智能的广泛应用也会带来网络信息安全、法律与伦理道德等诸多方面的问题。
但从发展阶段上看,现有的人工智能技术离实现通用人工智能、强人工智能还有很大差距。深度学习等人工智能技术本身存在一定的局限性,尚待进一步的发展和突破。如果人工智能技术不能与时俱进,其与各行业的深度融合就会受阻,进而会影响到其技术落地与商业化的潜力,导致其颠覆性价值不能得到体现。
◎人工智能技术带来的颠覆
在算法、算力、数据这三驾马车的拉动下,人工智能以超乎想象的速度进步,不断颠覆着社会生产生活的各方面。面向特定领域的人工智能由于应用背景需求明确、领域知识积累深厚、建模计算简单可行,因此形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能。如在图像识别领域,深度神经网络的统计学习模型持续创新,ImageNet图像识别的错误率已由2010年的28%降低至2017年的2%左右,明显超出了人类的平均水平(见图1-9)。
图1-9 ImageNet图像识别错误率历年变化
资料来源:Electronic Frontier Foundation.Measuring the progress of AI research.[2018-12-17].
在资本的追逐下,人工智能企业不断兴起,逐渐渗透进人们生产生活的各个方面。Bloomberg Beta风险投资人什芬·兹利斯(Shivon Zilis)对从事机器学习的企业进行了梳理,将人工智能企业分为以下几类:第一类专注于核心技术(core technologies),涉及领域包括人工智能、深度学习、机器学习、图像识别、语音识别、自然语言处理等;第二类专注于企业经营(rethinking enterprise),涉及领域包括销售、安全、欺诈检测、招聘、市场、智能工具等;第三类专注于产业界(rethinking industries),涉及领域包括广告、农业、教育、金融、法律、制造业、制药业、油气业、自动驾驶、医疗等;第四类专注于人类拓展(rethinking humans),涉及领域包括增强现实、姿态计算、情绪识别、机器人等;第五类专注于支持性技术(supporting technologies),涉及领域包括硬件、数据收集、数据处理等(见图1-10)。
图1-10 机器学习产业图谱
资料来源:Shivon Zilis.The current state of machine intelligence,2014.2018年该图谱已更新至3.0版本,参见http://www.shivonzilis.com/。
毫无疑问,人工智能已经渗透至社会各行业、各领域,智能翻译、智能选股、自动驾驶、智能搜索、定理证明、指纹识别、人脸识别、语音识别等相关应用已经无处不在。人工智能的价值在市场上已经体现得更为淋漓尽致。Gartner公司发布的数据显示,人工智能行业的总价值将在2018年达到1.2万亿美元,比2017年增长70%,而到2022年时人工智能的商业价值将达到3.9万亿美元。
人工智能的颠覆性影响,正在于其多学科融合、高度复杂的特性会引发科学技术产生链式突破,带动各领域的创新能力快速跃升。随着计算成本的降低、机器学习算法的进步和大数据技术的发展,人工智能的颠覆性潜力将会迅速提升。未来,所有的企业或许都可以被称为人工智能公司,因为当人工智能时代来临时,所有的事情、所有的业务都可以进行数据化、连接和运算,并且随之产生的智慧也可放置于云端,为人所用。
但与此同时,当前的人工智能技术具有高度的不确定性。新一代人工智能为人们生产、生活带来便利的同时,也对国家安全、社会治理、伦理道德等产生了强烈冲击。
以“人工智能伪造技术”为例,2017年5月,加拿大创业公司琴鸟(Lyrebird)发布的人工智能语音系统,可通过分析讲话记录与文本之间的关联,模仿人类讲话并加入逼真的情感和语调,成功模仿了特朗普、奥巴马和希拉里的对话;2017年7月,美国华盛顿大学开发出“可伪造真人视频”的人工智能技术,该技术可将音频文件转化成真实的口型并嫁接至视频中的人脸上,生成的新视频让人难以辨别真伪;2017年11月,英伟达利用生成式对抗网络(GAN)生成的人物照已经达到了真假难辨的地步(见图1-11)。随着人工智能技术的不断进步,音频、视频、笔迹和图片等数据的伪造技术将会更加逼真,甚至达到专业人士也难以辨别的地步。
图1-11 图片伪造技术的发展历程
“人工智能伪造技术”可对社会秩序的各个层面构成严重威胁。如在社会生活层面,“人工智能伪造技术”使日常生活所用的合同、契约、证书及相关法律文本的防伪鉴定面临新的困难;在司法层面,“人工智能伪造技术”将可用于伪造证人证言、视听资料、电子数据及鉴定意见等虚假证据,为司法证据的鉴定采用和非法证据排除带来新的困难;在公共安全层面,“人工智能伪造技术”为不法分子从事违法犯罪活动提供了便利条件。
◎以深度学习为代表的人工智能技术存在局限性
人工智能的概念自诞生起,就没有严谨的定义与界限。在1956年的达特茅斯会议上,“人工智能”的叫法甚至一度落后于“控制论”。但由于其具有浪漫主义色彩和通俗易懂的称谓,人工智能很快就抓住了人们的“芳心”。自此以后,政府机构、社会资本、科技巨头强势介入,使得人工智能研究获得了飞速的进步。
但从方法论上看,第二次和第三次人工智能浪潮都属于连接主义,没有本质上的不同。从研究范畴上看,人工智能包含的子领域众多,包括专家系统、遗传算法、机器学习等,深度学习仅是机器学习中的一个子领域。为何第三次人工智能浪潮获得了人们空前的关注?为何深度学习在商业上获得了巨大的成功?
究其原因,主要是人类对于人工智能的认知产生了显著变化。分别以符号主义和连接主义为代表的第一、二次人工智能发展浪潮,正是人类对人工智能抽象性认知的真实写照。但经历时间的洗礼后,这两次人工智能发展浪潮都遭遇了严重的失败。这主要是因为符号主义和初始的连接主义都是对人类大脑活动的模仿,并没有合理借鉴大脑产生智能的机制,最终导致结果不尽人意、人工智能项目纷纷落马。深度学习的成功,表明受大脑启发的人工智能是其能够得以广泛应用的根本原因。深度学习不仅依赖计算能力和大数据技术的进步,更加依赖卷积神经网络(CNN)等模型和参数训练技巧的进步。
毋庸置疑,以深度学习为代表的第三次人工智能浪潮取得了巨大的成功,人工智能应用正加速落地并不断商业化。但从人工智能总体发展水平来看,其仍处于初始的“起步”阶段。截至目前,人工智能的发展史可以简单近似为模仿人类智能的历史。随着第一、二次人工智能发展浪潮的失败,学者们纷纷将研究重心放在了神经网络模型的突破上。深度学习概念的提出与发展,直接开启了人工智能在学术界和产业界的第三次浪潮。但从本质上讲,深度学习是机器学习算法重要进展的体现,却并非颠覆性创新。
算法、算力、数据是深度学习成功的先决条件,但深度学习在算法、算力、数据以及认知层面均存在瓶颈问题(见表11)。在算法层面,人工智能存在黑盒子问题,效果无法预知,还存在个人经验主义和没有记忆能力等问题;在算力层面,目前的模型训练仍依靠蛮力计算,算力存在瓶颈,且面临摩尔定律失效的困境,计算性能增长变得困难;在数据层面,数据的透明性、数据攻击问题和监督学习问题成为人工智能的新瓶颈;在认知层面,现有的人工智能模型缺乏常识,因此无法理解实体概念,无法识别关键影响因素,且缺乏伦理道德。
表1-1 人工智能的局限性
资料来源:何宝宏.AI技术的天花板.电信网技术,2018(4).
谭铁牛院士则认为,人工智能的发展存在数据瓶颈、泛化瓶颈、能耗瓶颈、语义鸿沟瓶颈、可解释性瓶颈和可靠性瓶颈。他用“四有四无”概括人工智能总体状况:
●人工智能有智能没智慧:智慧是高级智能,有意识,有悟性,可以决策;而人工智能缺乏意识和悟性,缺乏综合决策的能力。
●人工智能有智商没情商:机器对人的情感理解与交流仍处于起步阶段,距离科幻电影中跟人类谈情说爱的人工智能还差很远。
●人工智能有计算没算计:人工智能系统可谓有智无心,更无谋。
●人工智能有专才没通才:会下围棋的AlphaGo不会下象棋。