科学之路
上QQ阅读APP看书,第一时间看更新

前言
我的科学之路

“哈尔(HAL)!把舱门打开!”在电影《2001太空漫游》中,一台名为“哈尔9000”的高智能计算机操控着宇宙飞船,而它拒绝执行为宇航员戴夫·鲍曼(Dave Bowman)打开分离舱舱门的命令,这一场景戏剧性地展现出人工智能的关键问题:系统转而攻击它的设计者,这是幻想还是有依据的害怕?我们是否应该担心终有一日世界会被终结者或几乎拥有无限力量和邪恶设计目的的智能机器人统治?越来越多的人提出这样的问题,因为我们生活在一场前所未有的变革之中。放在50年前,这种变革是不可想象的。那就是,我毕生研究的人工智能正在颠覆人类社会。

因此,我想写这本书来解释人工智能运作时的方法和技术,且毫不掩饰其中的复杂性。这一过程比学习国际象棋更难,但是我认为有必要对这个话题形成一个理性的认识。大众媒体上总是充斥着“深度学习”“机器学习”“神经网络”等术语,我想用通俗易懂的语言一步步地阐明推进计算机科学和神经科学交叉的科学方法。

在深入了解机器的旅程中,本书提供了两个层次的阅读目标:第一个层次较为基础,即叙述、描写和分析;第二个层次针对对此感兴趣的读者,本书提供了更加深入的数学和信息技术推理。

人工智能可以让机器识别图片,转译不同语言的语音,翻译文本,自动驾驶,自动操纵工业流程。人工智能近年来惊人的发展离不开深度学习。深度学习可以训练机器直接完成任务,而不需要对其进行显式编程(明确的编程指示)。人工神经网络是深度学习的特点之一,其架构和运作方式基于人脑的启发。

人脑由860亿个神经元构成,神经元细胞之间相互连接。人工神经网络也是由大量单元和数学函数构成的,与简化后的神经元类似。在学习时,人脑神经元之间的连接会被改变,人工神经网络在学习时也是如此。因为这些单元的组织通常是多层的,所以它们被称为神经网络,而人工神经网络学习的过程则被称为深度学习。

人工神经元的作用是对输入信号进行加权求和,如果求和总值超过某一阈值,则产生一个输出信号。人工神经元正是由计算机程序计算出的数学函数。可见,人工智能领域的词汇场与人脑中的词汇场相近,但这并不是巧合,因为正是神经科学领域的发展促生了人们对人工智能的研究。

我还想在这趟非同寻常的科学探索中追溯我的人工智能之旅。我的名字与改变了视觉识别的卷积网络密不可分。卷积网络受哺乳动物视觉皮层结构和功能的启发,能有效处理图像、视频、声音、语音、文本和其他类型的信号。

那么研究者做了什么呢?研究者的理念从何而来?对我而言,我经常凭直觉工作,同时也受数学的启发而工作。我知道许多科学家的工作方式与我完全相反。我会在脑中设想一些极端情况,也就是爱因斯坦所说的“思维实验”,即设计一个场景,然后尝试设想其后果,以便更好地理解问题。

这种直觉总会在我的阅读过程中出现。我贪婪地阅读,我熟知前人的所有工作。在探索之路上我们并非孤身一人,时机到来之时,那些已经存在的但尚未被提出的理念会一个接一个地涌入许多人的头脑中。科学研究也是一样,它的进展总是无序的,有时突飞猛进,有时停滞不前,甚至会走回头路。但研究这件事总是依靠集体协作的,发明者独自一人在实验室里工作的场景只会出现在科幻小说中。

深度学习的探索之旅并不容易,我们不得不与各个方面的怀疑论者做斗争。完全基于逻辑和手写程序的人工智能的拥护者说我们会失败,传统机器学习的捍卫者公开指责我们,可事实上,我们研究的深度学习仅仅是机器学习这个广阔领域中的一套特殊技术而已。谈到机器学习,机器不需要显式编程,基于例子就可以学习处理一项任务,这是有局限性的,我们希望可以突破这些局限性。深度神经网络,即我们提出的深度学习,就是突破局限性的方法。深度神经网络十分有效,但是运作也非常复杂,并且难以进行数学分析,但我们还是如同炼金术士般不懈追求着。

2010年前后,当神经网络终于被明确证明有效时,传统机器学习的拥护者停止了他们的挖苦。我本人从未怀疑过神经网络的有效性,我一直相信,人类智能如此复杂,因此,我们必须建立一个具有自我学习能力和经验学习能力的自组织才能复制它。

如今,在大量可用数据库和工具(如GPU,可使计算机的计算能力倍增)的推动下,这种形式的人工智能是最有发展前景的。

在学业接近尾声时,我曾打算在北美待上几年;直到现在,我还待在这里。在经历了不少波折后,我进入了拥有20亿用户的脸书工作,负责人工智能方面的基础研究。也是在那里,我开始了研究工作。我不想隐瞒脸书在2018年经历的风波,这场风波使公司遭受严重质疑,但脸书的业务领域仍在不断扩张。无论何时何地,我都坚持公开透明原则。

2019年3月,我获得了美国计算机协会颁发的2018年度图灵奖,这个奖项也被誉为计算机界的诺贝尔奖。我与两位深度学习领域的专家共获此殊荣,他们是约书亚·本吉奥和杰弗里·辛顿。这两位也是我的同路人,我们有时合作无间,有时又各自独立研究,但互相之间从未停止过交流。

我的职业生涯的进展多与上述经历有关,也与我能够在由一群富有激情的人组成的群体中逐渐占有的一席之地有关。这些人是20世纪50年代控制论的继承者,他们提出了一些深刻又大胆的问题,比如,神经元这些非常简单的物体是如何通过互相连接制造出“智力”这种涌现属性的。

研究深度学习的科学之旅也能够引导我们提出一些基本问题,比如,由于提取了轮胎、挡风玻璃等物体的特征,一台机器可以识别一辆汽车,那么其工作方式与我们的视觉皮层识别这辆汽车有什么不同?机器的工作方式和人脑或者动物大脑的工作方式之间有哪些可观测的相同点?这些研究前景都是无限的。

我仍要指出,无论机器多么强大和复杂,它们总是高度专业化的,它们的学习效率远远低于人类和动物,它们没有常识和意识,至少目前还没有。在处理特定任务方面,机器的表现可能会超过人类,比如,它们能够在围棋或国际象棋比赛中击败人类,能够翻译数百种语言,能够识别植物或昆虫,能够检测到医学影像上肿瘤的位置。但是人脑仍然遥遥领先,它比机器更全面,也更具可塑性。

机器何时才能缩小与人脑的差距呢?