人工智能的崛起时刻_科学之路-QQ阅读男生都市网

上QQ阅读APP看书，第一时间看更新

人工智能的崛起时刻

特伦斯·谢诺夫斯基
美国四大国家学院（国家科学院、国家医学院、国家工程院、国家艺术与科学学院）院士，《深度学习》作者

本书讲述的是人工智能（AI）历史上一个绝无仅有的时刻发生的故事。

在21世纪机器学习成为现实之后，人工智能也迎来了自己的关键时刻。在机器学习快速扩张的能力背后是活跃的研究圈子，而在这个圈子里，杨立昆是举足轻重的先行者。这一突破可以追溯到20世纪80年代的神经网络革命。我第一次见到杨立昆是在法国东北部小镇莱苏什的一次物理学会议上，那时候他还是学生，而他当时研究的内容后来演变成反向传播算法。杰弗里·辛顿（Geoffrey Hinton）和我此前在统计力学中得到灵感，向有隐藏单元的网络引入了玻尔兹曼机器学习算法。当时，神经网络还是新兴领域，物理学、心理学和工程学的领军人物鲜有涉足，也几乎没有人能预见到机器学习有一天会对世界产生这么深远的影响，但杨立昆已经把实现这个目标当成了毕生的事业。

后来杨立昆成为杰弗里·辛顿的博士研究生，再后来进了贝尔实验室当上了研究员，在此过程中，他一直在为这一目标不懈努力。他构想了一种神经网络架构，可以识别图像中的物体，这就是LeNet。随着计算机变得越来越强大，LeNet的规模也越来越大，性能不断提高。当时，关于计算机视觉的研究基本上都在强调几何特性，每添加一个对象都意味着要手动加入新的几何特征，这样才能将新对象与所有已有对象区别开来，而且需要有这个领域的专业知识，以及大量人工操作才能做到，因此进展缓慢。而在神经网络中，将不同对象区分开的特征可以从足够大的图像数据集里学习到。互联网提供了大量图片，计算机内存的增长速度也比处理能力的增长更快。杨立昆还有另一个有利因素，那就是他的架构很容易就能分布到多个并行工作的处理器上。

GPU（图形处理器）实际上可以有效模拟神经网络，这样能让计算能力提高上百倍，并让训练多达十余层的多层网络成为可能。杨立昆继续改进自己的神经网络架构，到最后形成了卷积神经网络（CNN）。尽管他的表现已经达到世界顶尖水平，但他的论文还是被计算机视觉领域最重要的大会——CVPR（国际计算机视觉与模式识别会议）拒绝了。

我还记得全世界是什么时候开始关注杨立昆的工作的。那是2013年在美国塔霍湖边举办的NIPS（神经信息处理系统大会，2018年已更名为NeurIPS）上，在识别当时最大的图像数据库“图像网”上的22000种不同对象的1500万张图片时，卷积神经网络将差错率降低了18 %，杰弗里·辛顿撰文介绍了这一成绩。此前差错率在以每年不到1 %的速度缓慢下降，因此这个成绩相当于整个计算机视觉领域20年的研究成果。从那以后，神经网络架构层级越来越深，也越来越复杂，而计算机视觉以此为基础取得了长足进步。

就在那一年的NeurIPS上，马克·扎克伯格（Mark Zuckerberg）在演讲中宣布，杨立昆将成为FAIR（脸书的人工智能研究实验室）的创始负责人，这是脸书为追赶谷歌而迅速成立的新部门，而谷歌那边雇用的是杰弗里·辛顿。杨立昆作为研究人员和工程师来说聪明绝顶、成就卓著，但管理大型的人工智能团队仍然是一份艰巨的工作，也需要有管理才能（跟做科研工作完全不同）。随后杨立昆组建了强大的团队，对脸书的业务产生了巨大影响。那天晚上在脸书赞助的一个招待会上，有人为我引见了扎克伯格。听说是我在负责NeurIPS，他并不怎么吃惊，但在告诉他我也是神经科学家之后，他问了我好多问题。很明显，他读过很多文献，问题也都切中要害。他最感兴趣的是心理学家所谓的心智理论，这是我刚刚组织的一个专题研讨会的主题，主要讨论我们自己和他人的内部模型。他让我推荐给他一份阅读清单。这个领域在心理学中尚处起步阶段，扎克伯格对这个领域这么有兴趣让我很惊讶，后来经过杨立昆解释我才恍然大悟。杨立昆说，在世界上所有公司中，脸书拥有的个人数据最多，用户也最多，有了人工智能，脸书就能为每个人的心智活动创建一个理论，做到甚至比这些人自己都更了解他们。

卷积神经网络的架构受到了灵长类动物大脑中视觉皮层的启发。视觉皮层中有多个分成不同层级的视觉区域，专门用来处理不同的视觉特征。在应对新环境方面，大脑比当前的人工智能系统要灵活得多，能力也要强得多。但现在，卷积神经网络在帮助我们了解大脑是怎么看见的，又是如何做出决定的方面，带来了良性循环。我们发现的大脑工作机制越来越多，这一反馈也增强了人工智能的能力，而如果只是以符号、逻辑和规则为基础的传统人工智能，就绝对不可能做到这一点。20世纪研究人工智能的人并没有意识到学习有多强大，不知道这是生物系统的核心要素，因此这就成为21世纪驱动人工智能向前发展的最大动力。还有一个很重要的区别是，以大脑级别的大规模并行架构为基础的算法比以逻辑规则为基础的算法要好得多，后者会出现组合爆炸。最后一点是，大规模网络模型中活动向量的表征能力和语义内涵都比符号要强得多。这么多计算方面的优势同时具备，极为少见。

我们站在一个新时代，它是信息时代的开端。现在的人工智能系统就好比莱特兄弟的第一次载人飞行。航空业经过数十年、上百年的不断创新已经得到了极大改善，相信人工智能领域也会如此。今天的喷气式飞机大大提高了我们的出行能力，而人工智能也将让我们变得更加聪明，并大大提高我们的生活水平。理查德·费曼（Richard Feynman）说过：“我无法创造出来的东西，我就理解不了。”机器能思考吗？机器会有意识吗？如果我们创造出了能学会思考的机器、能产生自我意识的机器，这些人工智能领域的大问题的答案也就昭然若揭了。杨立昆的这部著作，给我们讲述的就是人工智能在我们面前崛起的时刻，也是这个绝无仅有、将载入史册的时刻发生的故事。

本周热推：

人人都该懂的人工智能实战AI大模型 AIGC高效写作：如何发挥ChatGPT的无限创作力因果推断：基于图模型分析 ChatGPT写作超简单