前言
有句话说:“能者行之,不能者为师。”也有人说:“只有那些不会教学的人,才会尝试把知识点写下来。”然而这些观点都不适用于本书的由来。我花了四年时间周游世界,走访了钢铁厂、矿山、工厂、测试设施、设计工作室、机械车间、化工厂、油田、炼油厂、仓库和物流中心,向专业人士了解工业决策的挑战与机遇,然后与他们一起设计有用的人工智能来帮助他们做出更好的决策。
什么是自主AI
自主AI是由AI驱动的自动化系统,可以通过实时感知和响应来优化设备与流程。
现代人工智能的伟大之处在于编写能够根据反馈调整和改变行为的算法。本书的目标是向你展示如何通过教授AI在真实生产环境中做出成功的决策来使这些学习算法发挥作用。
这并不是说AI大脑(我通常会将特定的自主AI称为大脑)能够达到人类的同等水平或与人类能力旗鼓相当。我的意思是,当一个自主AI被正确设计,并且充分地利用了现有的AI和自动化组件时,它可以远远超越那些仅根据已知数学关系计算行动、使用客观标准搜索和选择行动,或依据录入的人类专业知识检索行动的系统。让我们一起更深入地了解自主AI的各个属性。
在工业智能场景中,人工智能研究与实用的类人决策之间有着巨大的鸿沟需要填补。因此,当人工智能研究表明AI可以学习如何执行复杂任务时,我承担起了找出AI在现实世界中可以学会并做出哪些决策的任务。四年前我开始探索AI决策能力时,学习型AI所能有效做出的决策仅限于视频游戏中并且大大简化了简单控制问题(比如在大学物理或工程教科书中会遇到的那些问题),这些问题已经被简化到学生可以把下一步做什么作为一个文字问题来计算。
快进到今天,我已经为大企业的现实应用程序设计了150多个自主AI,其中许多已经建成了,其中一些甚至做出了以往只有人类才能做出的有价值的、有效的决策。这些自主AI都在企业流程中执行有用的、特定的、重要的任务。
在所有那些从控制推土机到仓库调度再到食品制造的AI项目中,我得出了这样一个结论:真实的工业流程是复杂的,控制和优化这些过程的决策是模糊且充满了权衡的。人类的专业知识推动着这些流程,这些知识规模庞大且具有深度,无法被搜索解决方案的算法或先进的计算控制系统所取代。自主AI的确能在控制和优化这些系统、流程方面产生实质性的改进。前提是你必须深入了解这些流程的运作方式,并向领域专家学习,以设计出能产生这些突破性结果的AI。
如果你正在寻找有关AI是否被过分“炒作”或者AI是否有可能匹敌人类大脑全部能力的文章,那么这本书不适合你。
每天我都会看到关于AI完全是营销炒作,缺乏差异化价值的抱怨(好像AI真的是小说中才存在的虚构元素),或者AI正朝着超级智能发展并成为人类智能的竞争对手的言论(这种观点更像是科幻小说)。这两种观点都不正确。我的观点和经验是:AI确实具有与其他技术不同的决策能力,但它最适合被用于辅助人类思维做出特定的高价值决策,而不是复制人类思维。因此,如果你正在寻找一个关于AI是多么愚蠢或多么可怕的论述,那么你在这本书中可能找不到想要的东西。但是,如果你正在寻找一条路径、一个计划,以及设计AI的工具,使其能够解决目前尚未解决的问题,那么你来对地方了。
一些人对AI的能力夸大其词,而另一些人又不断地对AI的成就和技术大喊:“炒作!”造成这些现象的原因之一是没有去详细讨论AI与当前方法在特定任务上能力的差异。以自然语言处理为例,我在西班牙写本书前言时,我并不需要一个能理解和领会人类语言的AI来找出如何用西班牙语说出我的酒店房间号,143(ciento cuarenta y tres)的机器翻译在这次旅行中已经足够有用——我每天都用它来进入酒店的早餐区。但是,为我翻译房间号码的AI并不适用于做出总结(另一种与语言相关的任务)或写小说(一个更加困难的与语言相关的任务)。
这同样适用于我设计过的大多数自主AI。如果将AI脱离为其设计的任务背景,那么它很可能是“炒作”。但如果将AI用于特地为其设计的任务中,那么经过一段时间的实践后,它就不是“炒作”了。它将会超越现有的自动化,有时甚至能达到人类专家的水平。本书中充满了这类例子,在阅读完之后,你也能将之应用于自己的AI中。成功的大脑设计第一步就是将正确的大脑放在正确的位置上。找到机器正在做出糟糕决策的场景,用自主AI来更有效地做出这些决策。
谁应该阅读本书
流程专家
本书适合那些管理着复杂设备和流程的、寻求自动化的领域专家。
根据2018年Gartner的报告,全球约有1万名数据科学家。这意味着世界上大约有1万名能够使用代码从0到1设计并构建自主AI的人工智能专家。这些专家大多拥有人工智能相关领域的博士学位。相比之下,全球大约有1000万名软件工程师,大多数工程师专注于编写软件应用程序而不是研究人工智能。他们的专业领域是编写软件,并将其应用于各种不同的领域中。此外,全世界还有大约1亿名领域专家。这些机械工程师、化学工程师、流程工程师、控制工程师、供应链分析师、物流分析师等专家设计并管理着复杂设备和流程,他们对相关设备和流程都了如指掌。可以从图P-1中看到这些目标读者。
虽然人工智能专家、数据科学家和软件工程师可以使用本书来设计自主AI,但本书更多地是为那1亿名希望使自己负责的系统和流程更加自主的领域专家而写的。我不需要拥有人工智能相关的博士学位就能设计出这个自主AI的框架,那么你也不需要拥有博士学位才能使用它。
图P-1:本书的主要目标读者
数据科学家和软件工程师
数据科学领域正在蓬勃发展。我见过许多创新组织成功地将流程专家和软件工程师结合起来,不幸的是,我看到更多的组织反而希望数据科学家像魔法师一样拿出魔法棒解决流程问题,但是只给予他们有限的流程专家的帮助。本书可以帮助数据科学家学习如何从整体上看待系统和流程,以有效地整合流程专业知识,从而获得更好的、可部署的自主AI。
给人工智能专家、软件工程师和数据科学家的提示
我很高兴你正在阅读本书。这本书是为你而写的,自主AI开发过程中有一些非常特殊的部分,只有你们才能做到。例如,分析过程数据对于设计和构建自主AI至关重要,很少有人能比数据科学家更好地完成这项任务。同样,构建和集成机器学习(M L)模型也是如此——集成软件应用程序组件以构建自主AI需要软件工程专业知识。我唯一的忠告是,设计自主AI的过程需要对超出自身专业知识范围的系统和流程拥有极大的好奇心。虽然你可能可以在没有对人员和流程进行深入了解的情况下(例如,在工厂或物流操作中)就编写软件和构建机器学习模型,但你仍要从领域专家那里获得深厚的专业知识,才能有效地设计自主AI。
创新领导者
曾经有许多管理研发组织和咨询实践的创新领导者参加了我的面授课程,这对他们来说是一个很大的投入。他们选择我的课程是因为自主AI是他们业务的驱动因素,而我的课程定义了自主AI的背景和价值。这些领导者学习技术知识是因为他们希望在评估自主AI及其能力时能够辨别事实和虚假。创新领导者们,我邀请你们阅读本书,以帮助你们选择自主AI的案例并实践自主AI。
教师
这本书也是为教师而写的。教学实践对于设计良好的自主AI系统至关重要。教授机器的实践使我们必须剖析并阐明教学的方方面面,这样才能帮助我们更好地教授人类。
阅读本书的教师应该寻找机器教学提升他们的教学思维和实践的方法。
问题解决者
最后,本书是为那些想用自主AI解决现今世界中的重要问题的人撰写的。
科幻小说将自主AI定型为“杀手机器人”,而我们从科幻小说中重新定义了这项新兴而强大的技术,因为这项技术在能正确应用它的有创造力的人手中可以为人类带来很多好处。如果你读这本书是希望解决社会中的关键问题,并对世界产生积极的影响,那么我鼓励你深入了解技术细节和示例,并掌握教授AI做出真正有用行动的框架。我设计的AI可以帮助风电场产生更可持续的能源,帮助工厂减少排放,帮助建筑物减少能源消耗。我的学生为可持续渔业、垂直农业和许多其他重要目的设计了AI。你也可以做到。
你能从这本书中学到什么
通过本书的学习,你将了解如何设计先进的AI,而无须操纵神经网络或机器学习算法。我将介绍一些理论、大量具体的例子、一个可靠的设计自主AI系统的架构框架,并展示如何教授AI明确的技能和策略。你将学习各种AI的设计模式,学习何时使用每种模式以及如何组合模式。如果你遵循本书的内容进行实践,你将学到以下内容:
• 自动化和自主决策系统之间的区别
• 自主AI在实时决策方面的独特优势
• 如何通过模块化组件设计自主AI
• 如何应用设计模式从人类专业知识中创建可解释的AI设计
• 如何明确地教授自主AI已知的技能和策略
自动化系统可能很脆弱,需要人类不断地监督和干预。而自主系统以可解释的方式提供了更接近人类的决策能力,同时还可以帮助人类获得重要的工业技能。我想教给大家我用来为百事可乐、贝尔飞机公司、壳牌等公司设计100多个自主AI大脑的框架。设计自主AI对企业有很多实质性的好处,但我希望并期望会有许多读者利用他们对自主AI的新知识来更好地解决紧迫的问题。我之所以写这本书,是因为我想让你拥有设计自主AI的能力,以超越基准、革新行业,并对世界产生重大积极的影响。
最重要的是,我希望能影响你对技能构建、决策制定和问题解决的思考方式。
排版约定
本书中使用以下排版约定:
斜体(Italic)
表示新的术语、URL、电子邮件地址、文件名和文件扩展名。
等宽字体(Constant width)
用于程序清单,以及段落中的程序元素,例如变量名、函数名、数据库、数据类型、环境变量、语句以及关键字。
等宽粗体(Constant width bold)
表示应由用户直接输入的命令或其他文本。
等宽斜体(Constant width italic)
表示应由用户提供的值或由上下文确定的值替换的文本。
该图示表示提示或建议。
该图示表示一般性说明。
该图示表示警告或注意。
O'Reilly在线学习平台(O'Reilly Online Learning)
40多年来,O'Reilly Media致力于提供技术和商业培训、知识和卓越见解,来帮助众多公司取得成功。
我们拥有独一无二的专家和革新者组成的庞大网络,他们通过图书、文章、会议和我们的在线学习平台分享他们的知识和经验。O'Reilly的在线学习平台允许你按需访问现场培训课程、深入的学习路径、交互式编程环境,以及O'Reilly和200多家其他出版商提供的大量文本和视频资源。有关的更多信息,请访问http://oreilly.com。
如何联系我们
对于本书,如果有任何意见或疑问,请按照以下地址联系本书出版商。
美国:
O'Reilly Media,Inc.
1005 Gravenstein Highway North
Sebastopol,CA 95472
中国:
北京市西城区西直门南大街2号成铭大厦C座807室(100035)
奥莱利技术咨询(北京)有限公司
要询问技术问题或对本书提出建议,请发送电子邮件至errata@oreilly.com。
本书配套网站https://oreil.ly/designing-ai上列出了勘误表、示例以及其他信息。
关于书籍、课程、会议和新闻的更多信息,请访问我们的网站http://oreilly.com。
我们在Facebook上的地址:http://facebook.com/oreilly
我们在Twitter上的地址:http://twitter.com/oreillymedia
我们在YouTube上的地址:http://youtube.com/oreillymedia
致谢
首先要感谢的是我的家人!我的儿子Christien知道我所致力的所有“机器人大脑”,我的妻子Poppy是我做一切事情背后的驱动力。感谢妈妈Kate这么多年来一直支持我的想法。
感谢微软自主系统解决方案架构师,他们多年来一直与我一起在真实的客户项目中进行机器教学,包括第一个在2018年鼓励我写这本书的人Jeff Bennett,以及Marjorie Adriaenssens、Phil Harvey、Heather MacKinnon-Miller、Andy Wylie和Amanda Skrabut。
机器教学社区一直在教我事物在现实世界的运作原理。我非常喜欢与Dale Erickson、Winston Jenks、Grant Bristow、Sean Eichenlaub、Prabu Parthasarathy、Bridget Fitzpatrick(我们很想念他、Ed Van Valkenburg、Derek Bevan和Bryan DeBois的讨论)。
感谢Max Petrie、Ashe Menon、David Pugh、Pitak Jongsuwat、Yanon Lorpatarapong、Atik Suvittham、Francisco Green和Asim Ghanchi与我分享了如此多的真实系统和流程知识,感谢他们的资料!
感谢我在微软项目Bonsai中的队友:最初激励我进行机器教学的创始人Mark Hammond和Keen Browne;Marcos Campos,他开发了一些早期的机器教学基础;Victor Shnayder和Brice Chung,他们总是激励我深入思考机器教学;Gurdeep Pall,他为本书撰写了序;Dave Cahill和Kevin McCall,我和他们一起周游世界,与专家交流关于自主AI的话题;Julian Ostrow、Sandeep Kulkarni、Enes Bilgin、Hossein Khadivi Heris、Aydan Aksoylar、Khadija Mustafa、Ade Famoti、Mike Estee、Eric Traut、David Coe、Cyrill Glockner、Varsha Raju、Karen Veldeman和Brad Kerr。
特别感谢Teresa Escrig,她的编辑和关于书籍结构的讨论非常有帮助;感谢Kingsuk Maitra,他的想法不断激励我;感谢Scott Stansfield,我非常喜欢他讲述的技术故事;感谢Brian Evergreen、Denise Feirstein和John Alexander;感谢Kalyan Bansu和Kartavya Neema开发了我们在本书中提到的任务代数。感谢Andrii Antilikatorov的橡胶厂大脑设计。感谢Jonathan Schaeffer博士的人工智能研究及关于跳棋优化项目的讨论。
特别感谢西方社会研究学院(Western Institute for Social Research,WISR)的主席John Bilorusky,他提供的专业领域指导及教学方案的专业知识是非常宝贵的。本书的大部分研究都是在WISR进行的,其余的都是在微软完成的。
感谢IBM的内容开发团队,给了一个没有写作经验的机械工程师一个机会,并教会了我如何写作:Hai-Nhu Tran、Frank Eldredge、Shannon Rouiller、Ellen Patterson、Michelle Carey、Kristin Vincent、Dell Burner、Robert Heath和Andrea Ames。最后,要感谢我那些了不起的编辑:Rebecca Novak给了我写这本书的机会,Sarah Grey和Jonathon Owen进行了出色的编辑。一起写这本书是一种快乐。