未来机器人畅想
上QQ阅读APP看书,第一时间看更新

第1章 自动化的入侵

自从机器人出现以来,我们不仅想知道它们能做什么,还想知道它们应该做什么。不过,这样的争论似乎有点偏学术性,因为在日常生活中,机器人不知不觉地就开始在我们身边突然冒出来。我们似乎总是在追赶,而没有足够的时间来仔细思考技术以及技术在我们生活中的作用。有一天,自动驾驶汽车似乎就这样出现在道路上。我们越过了技术的临界点,自动驾驶突然变得触手可及,因此,行业、政府和风险投资者纷纷追逐这一热点,我们也被带动着跟随其后。机器人已经开始出现在商店里,它们在过道里上下滑动,寻找溢出物和其他安全隐患。在我们走访的波士顿郊区的车站和商店里,顾客对这一切泰然自若,至少目前如此。但超市员工想知道,这些机器人的角色将以多快的速度扩张。

新技术的出现往往会让人感到突然,甚至大呼神奇。这是因为我们大多数人都没有意识到,多年来,使这些突破成为可能的往往是渐进式的、商业上无趣的技术创新。偶尔,新闻中的一个标题会预示一些新概念的发展,但这些发展很快就会消失在大多数人的生活中。可能需要几十年的时间,相关机器人才能出现,才会把这些技术创新变成有市场的机器。

自动驾驶汽车预示着将会出现一批新的智能机器人,它们将在社会上得到应用。这标志着我们在日常生活中第一次有机会与自治系统分享决策权和控制权。梅赛德斯-奔驰早在20世纪80年代就开发出了第一批自动驾驶汽车,它们可以在没有车辆的街道上以最高39英里每小时(约63千米每小时)的速度行驶1。然后,在20世纪90年代和21世纪初,美国政府资助了日益强大的用于军事的自动地面车辆的开发,由国防部高级研究计划局(Defense Advanced Research Projects Agency,DARPA)赞助的大挑战项目更是使开发活动达到高潮2。在这些开创性的活动中,汽车的自动驾驶里程超过100英里(约161千米),包括在城市道路中。大约从2005年起,汽车行业开始认真投资,将自动驾驶汽车带入现实。特斯拉在2015年首次提出商用自动驾驶仪技术3。在所有这些故事中,似乎只有特斯拉及其同类竞争对手能够吸引公众的注意力。

从最初的设想到商业上可行的产品,30年的时间框架似乎是一个明智的选择。但是关于今天的自动驾驶汽车如何诞生的故事可以追溯到航空和工业领域中更早的历史。航空先驱劳伦斯·斯佩里早在1912年就发明了陀螺仪自动驾驶仪4,以保持飞机平稳飞行,但后来又花了几十年时间,在引入电传技术后才实现了自动驾驶仪的全部潜在性能,使得飞行员可通过电子信号而不是直接通过机械耦合到执行器来管理飞机的操纵面。第一架没有机械备用装置的纯电传操纵飞机是1964年首飞的阿波罗登月着陆训练车(Apollo Lunar Landing Training Vehicle,LLTV)5。F-16是第一架量产的电传操纵飞机6。1982年引入了一个完全集成的飞行管理系统来控制飞行的所有阶段,这是第一次允许机器在飞行过程中执行从起飞到着陆的全部动作序列7。因此,仅仅几年之后我们就看到了第一辆自动驾驶汽车,这也就不足为奇了。

在机器人领域,一个领域的突破会激发另一个领域类似的创新。2014年,谷歌翼(Google Wing)完成了第一次真实世界的无人机交互,2015年特斯拉的自动驾驶仪开始上路8。概念、传感器、计算机和软件因为不同的应用而各自逐步改进并得以广泛应用,最终汇聚在一起产生了看似突然的技术进步。当你在商店里看到一个机器人时,如果你感到惊讶,并且因为过道中间的小孩在追逐父母而担心机器人不能够安全地通过过道,想一想这里面的技术已经逐步细化了至少40年——这一事实可能会让你得到一些安慰。我们是如何达到这样一个阶段的——可以极大地改善生活的工作机器人即将变得无处不在,并且对于我们来说太复杂了,以至于我们无法控制自己,从而导致我们以前所未有的方式依赖这些机器人?

为了更好地理解一项技术进步与下一项技术进步是如何相互联系的,请把我们自己相关的系统作为智能生物来考虑,例如人类的感觉系统、遍布全身的神经网络,以及包括脊髓和大脑的中枢神经系统。每个组成部分的存在本身是不可思议的,但放在一起时,它们是神奇的。任何复杂的系统都需要一个感觉系统,不管它是由机器控制还是由操作员控制。在飞机上,许多仪器包括航向、空速和高度传感器。地面应用的感觉系统——如商店里的机器人或自动驾驶汽车——更侧重于环境成像和识别障碍。其中可能包括摄像头,它能像我们一样观察事物,并在光照和天气条件的配合下表现最佳;也可能包括雷达和激光雷达,它们分别发射无线电和光信号,并根据反射和反射回来的信号探测距离。无线电波被具有导电性的材料(如金属)反射得特别好,这使得无线电波在所有照明和天气条件下都能很好地探测标准的基础设施和物体(如车辆或机器人)。激光雷达用激光照亮一个场景,并测量反射光。它可以在白天和晚上可靠地、高精度地检测物体,但在雾和大雨等恶劣的天气条件下,它的性能就会下降。大多数机器人解决方案都使用多种类型的传感器,并将数据融合到所有需要的场景中,就像我们的眼睛、耳朵、手、鼻子和嘴告诉我们关于世界的不同事情一样。

在人类和其他动物中,中枢神经系统只有在有传感器连接到中央决策节点时才有用。机器的中枢神经系统与之相似:线控飞行或线控驾驶技术很像人类的神经系统通过神经传输电子信号来控制身体。

最后,大脑接受感官输入,形成对世界的理解,并根据这种理解做出决定,然后通过神经系统的其他组成部分实施行动。有些动物的大脑可能很简单,就像第一台Roomba一样,它遵循一个基本规则:按螺旋模式清洁,直到撞到墙,然后沿着墙走。在另一些情况下,机器的大脑可能很复杂,比如我们在路上看到的自动驾驶汽车,它们在施工区域和交通堵塞中导航的能力越来越强。

我们首先关注的是航空自动化和工业应用,比如核电站的控制中心,事实证明这些工作任务对人类来说太难可靠地执行。今天,核电站的许多安全程序都是完全自动化的,不需要人工干预。这些系统太复杂,人们无法手动监控或控制,故障的后果也很严重。换句话说,自动化使我们能够重新想象在自然能力达到极限后我们能够做什么。

因为环境受到严格控制,并且可遵循详细的任务程序,所以机器人在航空、发电厂和工厂设置等应用中表现突出。因此,机器人首先进入了那些很少有人能进入的工业世界,或者被安置在宇宙飞船里——这里进入的人更少。在这些孤立的世界里,工程师一步一步地开发机器人的传感器、神经系统和大脑,然后对它们进行测试,从失败中学习,并改进和强化这些新技术。今天,总的来说,复杂的工业应用都是由自动化控制的,只有很少的人工监督。

现在摆在我们面前的问题是如何最有效地利用机器人以使日常生活自动化。目前,汽车制造商、法律学者和工程师正就是否应该在驾驶的各个方面实现自动化,以及如何实现自动化展开激烈的辩论。是人车混合动力车最好,还是应该把人完全排除9?事实上,几十年前,当我们设计第一艘月球着陆飞船时,以及当我们为航空运输引入驾驶舱自动化时,我们已经不得不回答这类问题了。如图3所示,历史证明,看似很小的设计决策可能会产生几十年的影响,我们将通过一些示例来展示。

阿波罗登月着陆训练车是第一架电传飞机,本质上是第一架有中枢神经系统的飞机。其他的进步带来了阿波罗导航计算机,它是阿波罗指挥舱和阿波罗登月舱的“大脑”。登陆月球当然是一个复杂的问题,这是人类和机器都无法单独完成的。技术上的争论开始于计算机应该拥有多大的权力,宇航员应该拥有多大的权力。

图3 跨机器人应用的关键变化的实现时间表,描述了跨领域的技术趋势,并导致了工作机器人的出现这一阶段转变

在20世纪60年代一篇名为《人与仪器在宇宙飞船控制和导航系统中的作用》的开创性论文中,阿波罗导航计算机的设计者思考了这个问题10。他们讨论了在危机时刻或必须做出关键时间决定的时候应该在多大程度上信任计算机。工程师根据如何做出决策描述了三种类型的事件,第一类事件涉及具有预定响应的可预见条件,例如以预定速度自动切断火箭级。工程师说,这些情况很容易实现自动化。对于第二类事件涉及的可预见情况,“由于一般情况的复杂性,行动无法事先规划好,例如降落在月球上的任意地点”。工程师得出结论:第二类事件还不足以完全自动化,但人类的表现可以“通过对性能指标的反馈和仅显示相关信息来提高”。最后,还有第三类事件,即那些设计师或飞行员无法预料的事件。工程师认为,人类“在全新的情况下根据不完整的数据做出决策”的能力远远超过自动化系统。

除了技术的进步——特别是机器学习——已经改变了我们所认为的“一般情况的复杂性”或“一个全新的情况”外,所有这些在今天仍然适用。过去,我们不得不手工为各种情况下的自动化制定决策规则,而如今,机器可以利用数据或演示来学习人类决策标准的近似值——在手工制定的情况下,得到这些值可能过于复杂或耗时。然而,当意外发生时,自动化往往无法实现。2009年,全美航空公司1549航班途径加拿大,飞行员在飞机撞上一群大雁并失去引擎动力后,成功地在纽约哈德逊河上迫降,机上所有人都幸免于难,这一事件在后来被称为“哈德逊河上的奇迹”。商业客机的飞行几乎可以完全实现自动化,但一架自动客机能做到这一点吗?用今天的技术也许不太可能。今天没有任何人工系统能够复制人类创造性解决问题的能力。

即使是在自动化盛行的成熟行业,比如航空业,我们仍然在争论驾驶舱自动化应该控制什么,以及飞行员最终应该控制什么。当你登上一架飞机时,你可能不会多想它是空客还是波音。但几十年前,这两家公司选择了截然不同的道路,代表着飞行员和智能自动化应如何合作的不同理念。当自动化系统第一次被引入时,如果你乘坐的是一架空客飞机,那么飞机的系统会控制飞行员,但波音的情况恰恰相反。总的来说,自动化可以控制空客的飞行员,飞行员可以控制波音的自动化。这些方法源于机器人系统设计中的一个基本决定,这个决定涉及硬自动化和软自动化11。硬自动化对人为错误有更多的保护,本质上是限制用户做一些会把车辆置于危险的事情。软自动化仍然使用安全约束,但它认为自动化是一种帮助:当用户将要做一些可能危险的事情时,它提供警报,但允许用户继续操作,并在他们选择这样做时解除警报。后者允许更多的创造性的解决方案。换句话说,使用软自动化时,用户总是能够使用车辆的全部功能;而使用硬自动化时,在某些情况下,用户无法使用这些功能。

当然,每种类型的自动化各有利弊。例如,1985年,台湾中华航空公司的一架波音747在四万一千英尺(约十二千米)巡航时发生了引擎故障。它开始了无法控制的俯冲,并骤降了三万多英尺(约九千米)。在软自动化系统的帮助下,飞行员恢复了控制,乘客也几乎没有受伤。分析表明,硬自动化保护系统会禁止飞行员的输入,而正是这种输入使得飞行员成功地重新控制飞机。另一方面,可以这样说,空客飞行控制系统用它强有力的自动化保护来避免飞机进入不受控制的俯冲,因为它可以阻止飞行员使系统进入不稳定状态的行动。总的来说,保持人类飞行员创造性的判断、决策和行动的能力似乎是制胜的策略。一项对1988年至2002年间与自动化相关的9起重大事故的分析发现,空客涉及人-自动化协调故障的事故数量是波音的两倍12

这两种模式在日常生活中都面临着挑战。我们生活的世界充满了第二类和第三类事件,这些事件远远超出了现代机器学习和人工智能系统的管理能力。我们应如何设计这些系统,才能自然地将它们融入不可预知的世界?一个笨拙的机器人可能比没有机器人还要糟糕:往好了说,它可能会成为一个累赘,往坏了说,它可能会产生新的意想不到的安全风险。

自动化的历史跟随着技术史发展而来。自古以来,人们就一直在发明能够不间断地扩展自身能力的工具。例如,在准备饭菜时,我们首先用火做饭,然后用抹布或其他擦洗品帮助清理。后来这些工具变得更加复杂,变成了家用电器,从而使洗碗之类的工作变得更加轻松,或者大大减少了花在做饭上的时间和精力。在某些方面,采购、储存、准备和食用食物的过程变得更容易了;在其他方面,工具变得更加复杂。随着自动化技术和消费类机器人技术的发展,这些任务将变得既简单又复杂。我们面临的挑战是,构建的系统不仅要安全、方便,而且要强大、可靠。

在某种意义上,家用机器人总的来说是花哨的电器,因为它们仍然需要我们的关注。例如,机器割草机可以完成手动割草机的工作,但我们仍然需要把它们移到合适的地方,在院子周围设个栅栏,当它们卡住时把它们放出来,清洁它们,等等。这种类型的机器人将成为早期成功的机器人消费产品之一是有道理的,因为它执行的是范围狭窄且定义明确的任务(也称为第一类任务)。这些新的割草机与工业机器人系统相似,因为它们是为特定的任务和环境编程的。即使是很小的改变也需要人类付出巨大的努力来重新配置这项技术,因为它的程序中包含极其详细和精确的命令,只需简单执行即可,没有自主决策。如今,人们用具体的指令来增强工业机器人的能力。

相比之下,新型机器人将我们运送到城市各处,将食物送到家中,并保护社区安全,这些都是全新的技术。在复杂的人类世界里,这些工作机器人实现了前所未有的自主性操作。航空和太空计划是第一批努力摆脱工业系统模式的技术,其中自动化必须与人类能力模型共同设计,以应对第二类和第三类情况。

好消息是,我们拥有应对这一挑战所需的所有工具。我们已经分别为机器人的感觉系统、神经系统和大脑开发了技术,并且能够在新的应用中将这些技术正确地结合在一起。同样,在过去的几十年里,我们开发并拥有了一套丰富的工具,可以使机器人的能力适应人类的限制,使用起来就像做拼图游戏一样。我们将能够利用不可思议的学习能力去应对未来机器人的挑战,为工作机器人进行必要的调整,以增强人类的能力并改善世界。这些解决方案已经跨越了航空航天工程、人类系统工程和认知科学等领域。

做好这件事并不容易。你甚至可以称之为火箭科学。但正如我们在阿波罗导航计算机上看到的,设计机器人和人之间的合作关系将是自动化在这些应用中取得成功的基础。我们的登月计划是成功的,因为设计的关注点远远超越了底层技术,还包括为了设计系统而做的对人类心理与决策的分析和理解,这些使人与机器人能够在正确的时间以正确的方式进行无缝协作13

图4中的这幅漫画是20世纪60年代的作品,它抓住了当时的思想。美国国家航空航天局需要在自动化和手动控制之间找到合适的平衡。设计者不想让宇航员在降落月球期间承担太多的任务,因为他们可能无法跟上进度,不能充分发挥。但他们也不想让一切都自动化,以免宇航员脱离工作,在需要干预时无法进行干预。

图4 这幅来自麻省理工学院仪器实验室的漫画展示了自动化的极端影响。甚至在设计阿波罗登月舱的过程中,工程师也在考虑有多少工作需要自动化,有多少控制需要留给宇航员。如果自动化程度太高,他们担心宇航员会感到无聊,在需要时无法进行干预;但如果自动化程度不够,让宇航员手动控制太多事情,他们担心宇航员会不知所措。来源:美国国家航空航天局

我们在工作机器人上也遇到了类似的难题。在第2章和第3章中,我们将讨论航空航天和工业应用中的来之不易的经验教训,这些经验使人们对像《杰森一家》(the Jetsons)中的Rosie那样独立完成一切工作的机器人的愿景产生了怀疑。这种理想的机器人实际上是不可能实现的,甚至是不可取的。机器人没有和人类一样的能力,他们也不像我们一样思考。这是一种优势,但要了解如何让机器人适应人类,我们首先需要了解人类自身的局限性和优势——包括我们不恰当地信任他人的倾向。用户-机器人伙伴关系必须从一开始就考虑到这一点,以确保这些新的社会实体是有效和负责任的。Rosie会翻薄饼并不意味着你应该让它一个人做感恩节晚餐。

让事情变得更复杂的是,工作机器人的工作环境比驾驶舱或工厂里的环境呈指数级的复杂。公共场所很复杂,而且经常变化,比如修建了新的道路,关闭了人行道,改变了店面。更重要的是,许多人会接触到一个不知道它在做什么或会干扰到自己的机器人。我们每天都会适应在街上或商店里遇到不认识的人,但这种任务对机器人来说非常具有挑战性。在第4章中,我们将讨论如何使机器人具有最基本的旁观者意识,并在移动时适应这种状况。

当然,设计月球着陆器与设计消费品是完全不同的。后者的设计过程中将会有非专业的用户参与,而不是训练有素的宇航员,而且必须有一个积极的商业模式。事实上,正如我们将在第5章中看到的,当今的商业世界还不能很好地引导机器人走向社会。公司设计产品的方式以及消费者想要从它们那里得到什么,与自主的社会系统的设计方式是不一致的。工作机器人通常能够执行特定的任务,很少或不会与人互动,而消费品的设计本质上是为了取悦和娱乐用户。此外,我们很少或根本没有关注产品设计如何影响用户有效执行其他任务的能力。Facebook在乎对你的工作效率的影响吗?像社交媒体平台这样的消费品的设计初衷就是为了好玩,但这往往是以牺牲生产效率、透明度和活力为代价的。它们能够承担这种取舍,因为我们与它们互动的风险相当低。如果Twitter瘫痪,没人会受伤。相比之下,工作机器人则是让我们把那些自己不想做或无法安全地完成而又必须完成的任务交给它们。如果这些机器人不能很好地工作,或者在错误的时间分散我们的注意力,则可能产生重大后果。设计模型必须改变为专注于确保机器人任务成功执行的最好的方法。

事实上,研究表明,用户的偏好往往与最佳性能甚至是安全操作的设计直接冲突。用户往往喜欢那些对手头的任务没有多大帮助的系统,换句话说,取悦用户的特性通常不是为了获得最佳性能结果而优化的14。对于工作机器人,这意味它可能在用户不希望被打扰时需要用户的干预,而在用户想干预它的活动时,它却不需要。简单地说,取悦用户的工作机器人实际上可能表现得并不好。这一点现在比过去更加重要,因为与过去的任何消费产品相比,工作机器人的风险更高。机器人是功能强大的机器,但如果做不到有效的安全和管理,它们也会对社会构成风险。

我们的世界是复杂而动态的,而我们与生俱来的创造力和判断力,即使是最先进的机器人也难以企及。机器人的大脑仍然很简单,它们完全按照指令、程序或训练的方式行事。我们成功地将工作机器人融入日常生活的唯一机会是接受这一事实,重新规划消费产品设计理念,专注于在机器人和人之间建立正确的合作关系。

要想成功实现工作机器人,就需要一种新的语言和方法来让它们与人类彼此交流。在第6章中,我们将概述自动化功能的必要性,这样当你与一个工作机器人接触时,就知道该做什么或说什么来影响这个机器人,而不需要特殊的培训或专业知识。这些自动化功能必须足够清晰,以便用户能够快速理解如何以及何时采取行动,因为机器人可能会造成只有人类才能避免的安全风险。在第7章中,我们将描述机器人之间的沟通需求,以解决直接冲突、协调活动、分享关于世界的知识,这可能会让所有机器人都有更好的机会获得成功,类似于我们今天使用的众包地图产品。这些地图产品帮助我们在城市中导航,避免交通堵塞,但它们对机器人更重要,因为机器人的感觉系统更弱,在应对突发事件时不像人类那么灵活。

使用新型工作机器人的用户不仅不是专家,而且他们所处的环境也很混乱。如果我们想让机器人承担像送披萨这样的任务,就不能只是简单地给它们留出空间。在第8章中,我们将讨论工作机器人在日常生活中的环境设计,从机器人的角度来看,这是不受控制和不一致的。想想在城市街道上保持在车道线以内的简单问题。施工项目、天气和正常的路面磨损都有可能破坏清晰的车道标识,人们非常善于适应这些变化,并且当依赖的结构退化时,他们会格外警惕。但机器人还不能驾驭这种模棱两可的情况,即使是物理环境的微小变化也会让机器人迷失方向——这使得安全机器人的设计在规模上非常具有挑战性,甚至是不可能完成的。如果我们不能依靠一致的车道线,那么机器人设计师就必须想出一种不同的方法来决定如何停留在车道内。为了解决这个问题,自动驾驶社区开发了非常精确的地图,以厘米为单位为行驶的每条道路绘制地图,然后结合非常精确的定位解决方案,能够非常准确地知道机器人在地图上的位置。这种方法需要高端传感器。所有这些都是昂贵的,即使这样,一些漏洞仍然存在。即使是最精致的机器也无法解决这个问题——相反,这需要借助经济和政治手段来改变私人和公共基础设施。

如果我们能够接受这一现实,并开始以一种新的方式设计工作机器人,那么我们就有机会用新型动态设备来改善日常生活。这些新设备将离开我们的工作台,走出我们的家门,开始帮助我们完成各种任务,在这个过程中,它们将获取和使用以前不可能获取的数据。

随着工作机器人规模的扩大,这些数据将变得更广泛,我们将有机会收集和分享这些数据,以提高不同公司的机器人的表现。在第9章中,我们将描述这种数据共享如何在航空领域发挥作用,以及如何将航空经验应用到机器人领域。例如,在航空领域有一个事故数据库,它匿名地收集航空公司、客机和飞行员的未遂事故和事故数据。这个数据库为空中自动化的安全和漏洞方面提供了大量知识基础。对于工作机器人来说,数据收集和共享甚至更为重要,因为它们是基于大量数据开发和训练的。虽然企业可能更愿意通过囤积数据来保持竞争优势,但如果我们能够打开这些宝藏,让每个人都可以使用,社会将获益更多。

我们希望这本书能帮助整个社会重新思考如何设计工作机器人,让它们成为有责任感的社会实体,这样我们就能对世界做出调整以适应这些新实体。工作机器人有独特的需求,这也给我们提出了新的挑战。我们推荐的一些解决方案可以开启关于技术和社会之间关键交叉点的对话,这样我们就能认识到工作机器人会在未来的日常生活中帮助我们。现在是我们利用开发的有效工具完成下一次飞跃的时候了。如果我们选择接受这个任务,我们将为工作机器人做好准备。