Siri:做最好的倾听者及说话者
除了模式识别,列维和莫尼恩还强调,在新劳动分工中,复杂沟通(complex communication)只能在人类中存在。他们写道:“一些重要的能够产生良好效果的沟通和交流,比如在教学、管理、销售和其他职业活动中,需要对大量的信息进行说明,并进行沟通和交流。在这些情况下,与一台计算机交流信息,而不是与另一个人交流信息,有一段很长的路要走。”
2011年秋,苹果公司推介了其手机产品iPhone 4S独具特色的Siri(iPhone 4S的语音个人助理服务)语音控制功能,该功能由一个智能、私人助手通过自然语言使用界面实现。也就是说,人们对这位“助手”讲话就像对另一个人讲话一样。基于Siri语音控制功能的软件,实际上来源于加利福尼亚研究机构斯坦福国际研究所,只是在2010年,苹果公司购买了这项技术。这项技术的使用者只要对着iPhone说话,手机听到后就会辨别出使用者想要做什么,然后采取行动,并以一种模拟的声音把结果反馈给使用者。
在Siri语音控制功能出现之后8个月,技术博客Gizmodo的凯尔·瓦格纳(Kyle Wagner)罗列出了Siri最有用的功能:“你可以问它现场比赛的得分——巨人队在比赛中得了多少分,或者每个参赛队员的得分情况。你可以通过OpenTable平台订餐,在Yelp网站上了解商家评分,询问当地剧院的电影放映信息并观看预告片。如果你很忙,无法接听电话,你可以让Siri提醒你随后把电话打过去。这些事情可能是我们每天都要碰到的,你会发现Siri的语音功能非常有用。”
Gizmodo的博客文章以提醒式的口吻结尾:“这些功能听起来非常酷,但别忘了Siri的信条是:但愿它能真的有用。”在这一功能正式发布后,很多人发现苹果手机的智能私人助手并没有那么灵验。它有时不理解使用者的问话,会提示使用者重复问话,有时向使用者提供的答案很奇怪或者不准确,有时它的回答就像:“真的很抱歉,我现在无法回答你的问题。请稍候再试。”分析师基恩·蒙斯特(Gene Munster)把Siri很难回答的问题总结了一下:
· 埃尔维斯埋葬在哪里?Siri的回应是:“我无法回答你的问题。”因为其智能系统把这个人的名字理解为“埃尔维斯·埋葬”(Elvis Buried)。
· 电影《灰姑娘》什么时候上映?Siri的回应是在Yelp网站搜索到一个同名的电影院。
· 哈雷彗星下一次什么时候出现?Siri的回应是:“你没有与哈雷的约会安排。”
· 我想去苏必利尔湖。Siri则直接对你说出“苏必利尔湖X射线”(Lake Superior X-Ray)这家公司的名字。
Siri有时既离奇又让人困惑不解的回应已经众人皆知,但这项技术的发达程度是不可否认的。有时候,它的确能给你精准的帮助。也是在那次无人驾驶的体验过程中,我们很直观地看到了一点。那是在旧金山的一次会议之后,我们驾驶着租来的汽车开往位于山景城的Google总部。我们的车上有一个便携式的GPS导航装置,但并没有插上接口、打开开关,因为我们认为能够顺利地抵达目的地。
我们失算了。出现在我们面前的是迷宫般的高架路、出口匝道以及城市街道,我们甚至连其中一条路的入口匝道都找不到。正当我们异常紧张、一筹莫展的时候,埃里克拿出了他的手机询问Siri:“101国道向南的行驶路径。”而手机的回应既迅捷又精确:手机屏幕指示的地图清晰地标示出我们的位置,同时说出了如何才能找到那个难找的匝道入口。
我们本来可以靠边停车,打开便携式GPS导航仪以确定目的地,但我们并没有打算按照那种方式获取线路信息。我们想要的是说出问题,随后能够听见和看见(因为需要用到地图)回复。Siri能够提供我们一直在寻找的准确的自然语言界面。记得在2004年的时候,还有一篇对持续半个世纪的自动语音识别(自然语言处理系统的核心部分)研究进行的评论,这篇评论认为:“人类水平的语音识别被证明是一个难以达到的目标。”然而在不到10年的时间里,这个目标就已经基本实现了。苹果公司以及其他公司所开发的自然语言处理技术在数百万手机用户那里得到了应用。正像卡内基–梅隆大学机器学习系的主任汤姆·米切尔(Tom Mitchell)所说的:“我们正处在一个10年期的起点,在这10年时间里,我们的研究将从计算机不能理解语言过渡到计算机对语言驾轻就熟。”