2 人工智能:构建未来科技新世界
第一节 人工智能:最熟悉的陌生人
说人工智能熟悉,是因为这个概念在2016年就大火了一次。
你一定记得,那一年,AlphaGo打败了韩国围棋高手李世石;美国白宫发布了《国家人工智能研究与发展战略计划》;微软、谷歌、IBM、亚马逊等组成了超级人工智能联盟。最让大家惊叹的要数特斯拉,Model X汽车凭借自动驾驶功能,将一位驾驶途中突发肺栓塞的车主准确送到了医院。
最近几年,人工智能获得了更为突出的进展。在2019年的网络春晚上,几位央视主持人携手自己的“孪生”人工智能主播一起完成了主持,连撒贝宁都感慨,正在直面自己的未来职业危机。
两会期间,新华社推出的首款人工智能合成主播“新小萌”,吸引了不少观众的注意。生动的表情、端庄的仪态、亲和的声音,让很多人都不敢相信,这竟然是个虚拟人物。与此同时,《人民日报》也推出了自己的人工智能虚拟主播“果果”。在系统中输入文字稿几分钟后,“果果”就能流畅地将新闻播报出来。
如果我们继续往“前”看,还能看到人工智能的历史线索。
在2500多年前的《偃师造人》故事里,周穆王巡游天下时,有一位“机械舞者”不但舞跳得好,还会用眼神“勾引”穆王的妃子。周穆王看到如此逼真的人偶后愤怒不已,认为下属用真人欺骗自己。下属立刻打开了“舞者”的胸膛,展示给周穆王看。里面有复杂的物理结构,用木头和毛皮制作的各种器官,挂在对应的钩子上。
人类对人工智能的探索,延续了上千年,一直都有迹可循。那么,陌生又是怎么回事呢?
最近几年,我们听过无数关于人工智能的威胁言论。这些言论的套路都差不多:先是取代人类工作,然后取代部分人类,最后毁灭人类。
这些不靠谱的言论让大众对人工智能的理解越来越“偏”,也越来越陌生,就好像人类对科学的探索,最后却是为了消灭自己。为什么科幻电影中那些美好的向往,都与我们的现实背道而驰呢?
对此,我们需要明确一个现实:
人类的复杂程度,远超人工智能上万倍。至今为止,人类对自身的了解还远远不够,更不要说创造一个大幅超越人类的人工智能系统。短时间来看,有关人工智能取代人类的忧虑,确实有些可笑和多余。
但是,我们还是需要对人工智能保持重视。毕竟,人工智能已经成为产业变革和科技创新领域的头部力量,理解并认识它,能够让我们的生活更美好。
人工智能不只是机器人
在谈及人工智能之前,大家首先要明白一些人工智能的基本概念。
我们先用一句话解释一下人工智能的含义:人工智能就是让计算机完成人类心智能做的各种事情。
为了更好地理解人工智能,我们把它粗略地分为三个等级:弱人工智能、强人工智能和超人工智能。下面我们来依次理解这几个词:
弱人工智能
这是一种擅长处理单方面工作的人工智能系统,它们只专注于完成某个特定的任务,例如图像识别、语言识别和文字翻译等。
它们的存在,主要是用于解决特定的具体类的任务问题,大部分与统计数据相关,以此从中归纳出模型。由于弱人工智能擅长处理较为单一的问题,且发展程度并没有达到模拟人脑思维的程度,因此弱人工智能仍属于“工具”的范畴,与传统的“产品”在本质上并无区别。
比如工厂流水线上的机械臂,它们可以不知疲倦,快速并准确地完成工作目标;再比如名声大噪的AlphaGo,能够打败所有人类高手。
强人工智能
如名字所言,强人工智能是可以比肩人类或超过人类的人工智能系统。它能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作,并且和我们人类一样得心应手。
强人工智能的目标,是使机器在非监督学习的情况下,处理前所未见的细节,并同时与人类开展交互式学习。在强人工智能阶段,由于系统能力已经可以比肩人类,同时也具备了“人格化”的基本条件,因此机器可以像人类一样独立思考和决策。
不过,目前还不用担心。这个程度的人工智能,我们还造不出来。如果一定要找一个例子,那么你可以参考一些科幻影片。比如,《机械姬》里面的艾娃和《人工智能》里的小男孩大卫。
超人工智能
在所有的领域都比人类更强,包括智力和寿命。目前,超人工智能还存在于科学家的假设之中,它也是很多科幻电影的素材来源。
有一点很重要,我们不要偏颇地认为人工智能就是机器人,这是错误的。
我们广义上所说的人工智能是指能力,而不是设备。机器人只是一种人工智能的表现方式,因为机器人表达得更加明显一些,这种形式人类能够用眼直接感觉出来。而另一种体现方式则是软件,不过因为人工智能软件体现得没有机器人那么明显,所以造成了很多人认为人工智能就是机器人,机器人就是人工智能这样的错误理念。
人工智能铁三角:算力、算法与数据
说完了分类之后,我们再来看看人工智能所需要的条件。
想要创造一个人工智能系统,需要由两个主要的技术构成,即前端的交互入口与后端的人工智能技术。
让我们先了解一下前端的交互入口。
首先要提到的就是自然语言的处理能力。我们人类的交流,主要依靠的是语言。汉语、英语、法语等各种语言体系,不仅字符和读音不同,就连语法体系和表达习惯也大相径庭。
过去,我们与计算机交流的方式是键盘、鼠标和触摸板,这些通通属于机器语言的范畴。而人工智能时代,第一个要完成的就是自然语言的处理。简而言之,让机器能够直接听懂人说的话。
其次,是体感互动。除了语言之外,人类的肢体动作也是交流的重要组成部分。抬手、转头和迈腿等肢体动作,往往能够传递出人类更为真实的想法。建立体感交互系统,可以帮助人工智能更全面地理解人类的思想,也是最方便的一种交互方式。
当前,体感互动主要应用于游戏领域,索尼的move、任天堂的Wii等都是非常受欢迎的体感游戏设备。这足以说明用户对体感交互是天然接受的,而且认为这是人和机器最自然的交互方式。在可见的未来,体感交互能应用于更多的领域,包括残障人士的人机交互、智慧医疗领域的病症识别,以及仿真机器人的模拟训练等。
最后,是图像处理和视觉识别。对于交互机器人来说,图像识别的技术让一些弱人工智能功能得以实现。除了简单的图片辨别之外,我们所熟悉的自动驾驶,以及辅助类机器人都需要这一技术。有了这项技术的加持,机器人能够像人类一样参与环境的互动,完成躲避、绕行、距离跟随和范围警示等功能。
前端交互技术一直被业界称为人工智能的入口,并占据非常重要的地位,也是各家人工智能企业争夺的高地。一个人工智能系统如果拥有的入口越多,获得的学习机会就越多。那么,它在下一次执行相关指令时,就会比其他系统更加“熟练”和“聪明”。
从另一个角度上看,这也是技术领域的一种雪球效应,参与越早,入口越多,获取的用户也就越多。大量的用户反馈可以快速地帮助人工智能系统进行深度学习和快速改造,优势也最终会体现在产品层面,赢得更多的市场青睐。
入口的背后,则是人工智能的核心技术。想要抢占市场先机,只有入口肯定是不够的,还需要企业将入口汇聚而来的数据进行消化和再加工。
人工智能的技术框架
核心技术里,第一个要素是算力。
人类的各种行为,都依托于人脑计算后发布的指令。大脑中的每个神经元都是一个非常复杂的非线性处理系统,如果把每个神经元当作一个核心,那么大脑就是一个拥有1000亿个核心的CPU系统,它构成了人类大脑的主要意识。
人工智能想要达到与人类相同的行为水平,自然也需要超强的运算处理能力。幸运的是,我们不必再花巨资去建造算力,而可以通过支付一定费用,购买或者租用大公司的算力服务。
第二个要素是算法。
算法是计算机特有的一种处理问题的逻辑,即解决某个问题的计算方法与步骤。
你大可将它看作我们做饭的菜谱,洗菜、切菜、焯水、下锅爆炒、放调料然后出锅。在某个特殊的场景里,计算机只有按照对应的算法,才能够解决某个特定的问题。
现在,许多大企业都公开了自己的人工智能算法,供企业和个人使用。算法的公开,可以让更多的人使用并传播,从而形成领域内通用的标准。
算力可以购买,算法是公开的,那么人工智能最麻烦的部分在哪里?
答案就是第三个要素:数据。
那么,数据在哪里呢?它们不在人工智能企业里,而是藏在传统企业那些亟待提升和解放的工作流程中。
说得透彻点,有数据的企业,在人工智能时代才有竞争优势,但一切的前提是,它要拥抱人工智能。用人工智能工具,结合自身的独特数据,提升自身的生产效率。
数据结合人工智能的过程,就像是一个教练培养体操运动员的过程。运动员做的每一个动作,教练都会站在一旁进行纠正和调整。运动员不断地练习,教练不断地纠正,久而久之,运动员就能够完成自我纠错,最终达到理想的结果。
需要说明的是,目前人工智能最能够发挥的领域,一定是拥有大量重复劳动,并且能够明确判断好坏标准的场景。比如提高机床零件加工良品率,辅助影像医生识别患者病灶,或者帮助运动员完成特定项目的训练。
无论你如何看待人工智能,它已经走到了人类历史舞台的中央。跟当初的互联网一样,人工智能正快速地在各个产业开花结果。