爆发:大数据时代预见未来的新思维(经典版)
上QQ阅读APP看书,第一时间看更新

引言 历史不会重演,却自有其韵律

虽然万事皆显出自发偶然之态,但实际上它远比你想象中容易预测。马克·吐温曾说过:历史不会重演,却自有其韵律。忘掉那些将生命看做掷骰子或是巧克力盒的比喻,把自己想象成处于自动驾驶状态的做着美梦的机器人,你就会更加接近真相。

果不出意外,在你读完此书后,我会让你相信,虽然万事皆显出自发偶然之态,但实际上远比想象中容易预测。这绝非我的个人臆断。跟身边一同生活以及工作的每个人一样,我本人的行为也是容易预测的。事实上,我实验室里研发的那套揭示人类可预测程度的演算法,是对无数人进行试验的结果——但只对一个人不适用,他就是哈桑,哈桑·伊拉希(Hasan Elahi)。

哈桑的旅行

这是底特律大都会国际机场,五十多个外国人被移民局扣留在这里,哈桑也在其中……空气中弥漫着焦虑的气息。“能看出他们是第一次来美国,每张脸上都写满了恐惧,”哈桑回忆道,“但这令我很困惑——我为什么也被带到这儿来了?”

哈桑的护照先后三次被延期,上面盖满了边境章,拿在手里厚厚的,就像一本廉价的平装小说,不难看出,他早已对移民和出入境问题有了相当的了解。按理说,美国公民入境时是不会被移民局扣留的,至少通常情况下不会。困惑多于恐惧的哈桑试图从警卫那里了解被扣留的原因,但随后发现他们跟自己一样不解。

最后,一个穿着深灰色制服的人走到他面前,以一种公式化的语气开门见山地说:“你没我想象中的老。”

这个开场白让哈桑觉得颇为尴尬,为了缓和气氛,哈桑试着用一种轻松的口吻回答:“抱歉,我也在努力让自己赶紧变老。”

这么说一点儿用都没有——这个时间,这个地点,任何玩笑都开不得。所以,哈桑决定切入正题:“你能跟我解释一下是怎么回事吗?”

他看着哈桑,沉默数秒,似乎在试着找寻适当的表达方式,但最后他只是耸了耸肩,用一种不带任何感情的语调说道:“恐怕你得自己解释。”

事情发生在2002年6月19日,30岁的哈桑·伊拉希是一位多媒体艺术家,当时他刚结束了为期6个月的疲惫旅程准备回家。在此期间,哈桑从佛罗里达州的坦帕飞到了底特律,然后辗转阿姆斯特丹、里斯本和巴黎,最后又到了塞内加尔的达喀尔市。10天之后,他又乘长途巴士费时48个小时去了马里首都巴马科,随后又到了科特迪瓦。在参观了非洲最大的教堂之后,哈桑在5月28日抵达了科特迪瓦南岸的主要港口阿比让。旅行到此,他已经筋疲力尽了。“西非就在眼前,这简直就是考验我的耐性。”他回忆道。在一场暴雨冲塌了他投宿的旅馆房间之后,他觉得是时候离开了。他飞回达喀尔,但仅在一天之后就又坐上了前往比绍的巴士。然后,他又接连穿越了两个边境,还没回到塞内加尔,他就在冈比亚将满头金发用红丝线编成了发辫。

哈桑花了六七天时间为达喀尔双年展设计了一套艺术装置。随后,他返回巴黎,乘火车去了斯特拉斯堡,然后步行经由德国边境去卡尔斯鲁厄一个以数字艺术收藏著称的博物馆参观,又顺便去卡塞尔看了看文献展。在这之后,他又从汉诺威飞到了葡萄牙最南端的旅游胜地法鲁。在海滩游玩了两天之后,他在里斯本机场过了一夜,并在第二天一早飞回美国。

此时此刻,周身散发着成熟气息、顶着一头红色长发辫的哈桑,就在密歇根州底特律市的一个小小讯问室里,试图找到最为恰当的答案回答那个穿着深灰色制服男子的问话——“你都去过哪儿?”

该从哪儿说起呢?他决定尽量长话短说,“嗯,我刚从阿姆斯特丹回来。”

“之前呢?”那个人又问道。

“里斯本。”

“再之前呢?”

“法鲁的海滩。”

哈桑一个接一个地回忆他到过的地方,当说到达喀尔时终于有机会停了下来。

“那是哪儿?”那个人问道。哈桑看了看面前那张木纹L型桌,意识到这不是测试或是玩笑——那个男子确实不怎么清楚达喀尔在哪儿。

“虽然还是不知道到底发生了什么事,但我估计可能跟恐怖主义有关,而我则被当成了嫌疑人,问我话的人也许是政府官员或执法者,”哈桑回忆道,“很显然,这时不能对他们发火,也不能说你真是个笨蛋,连西非最大的城市都不知道。不管有多想说出口,也绝对不能说。我必须冷静下来,然后尽量表现得很合作。”

所以,哈桑用手指在桌面上画了一幅虚拟的非洲地图,然后指着它的西部,解释说,达喀尔是美国当年进行奴隶交易时一个非常重要的中转站。

“那儿有穆斯林吗?”那人接着问道。

“有,总人口的95%都是。”哈桑略带讥讽地答道。

“你在这些地方都见了什么人?”

“艺术家,就是一些艺术界的人,作家,记者。”哈桑答道。然后,他开始耐心地解释一些有关艺术的事。

“你是搞什么艺术的?”

这个问题同样不太容易回答。哈桑虽说是一个艺术家,但他的作品不是可以挂在家中餐厅里的那种,而是一些富于美感和灵感,以一种独特而又犀利的角度呈现周围世界的作品。举例来说,他在达喀尔设计的那套装置本身是一个4.5米高的通信塔。该塔全部由竹竿建成,顶端还装上了电线。塔内有四盏氖灯,将塔身渲染成蓝色,而且塔内安放的扬声器会随意发出嘶嘶的声音。在一般人眼里,这些东西并没有什么意义,但实际上,其中的每个元素都富含深意。

塞内加尔给哈桑的第一印象就是每样东西都是那么的蓝。“特别是当你站在海边,看着那蓝蓝的水、蓝蓝的天,那景色真是棒极了。”他回忆道。基于此,他才在装置中加入了蓝色的氖灯。另外,他还注意到塞内加尔人在交谈中会发出嘶嘶声。令人费解的是,就算两人离得有半个街区远,其中一人也能听出是谁在“嘶”他。因此,在装置中放一台扬声器是必不可少的,它能让大家看看塞内加尔人对一个会“嘶”他们的艺术品有怎样的反应。

一想起那个审讯官要求他解释自己的艺术专业,哈桑还是会忍不住笑出声来。“就算跟其他艺术家讲都很费劲,”他饶有兴致地回忆道,“更别提向一个执法者解释了。”由于那个装置很像一座雕塑,所以他干脆对那位审讯官说:“我是一个雕塑家。”然后就到此为止,因为要是提及多媒体装置,无疑会让事情变得更复杂。

然后,审讯官突然问了下一个问题:“你在大学附近是不是有个仓库?”

“没错。”哈桑点头道。自从进入南佛罗里达大学任教并搬到坦帕后,他就租了一个仓库。

“里面都有什么?”

“一些在佛罗里达穿不着的冬衣,一些我的小公寓里放不下的家具,还有一些淘来的旧东西,因为我这个人什么东西都不肯扔——里面只是一些乱七八糟的东西。”

“没有爆炸物?”审讯官现在才开始问一些令人疑惑的问题。

“没有,我敢保证里面没有任何爆炸物。”哈桑回答道。

在这之后,随着一个接一个问题,哈桑逐渐弄清了自己被扣留的原因。数周前,坦帕的联邦调查局接到线索,说一个在仓库里私藏炸药的人于2001年9月飞去了国外,而这个嫌疑犯的名字,就叫哈桑·伊拉希。

“虽然没有证据,但我敢确定一定是租给我仓库的老板报告的。我认识他们,每月去付仓库租金的时候,我都会坐下来跟他们闲谈,有时候甚至会聊几个小时——那是一对老夫妇,他们是从肯塔基州搬到坦帕来经营仓库出租生意的。

“你应该先了解一下当时的国民心理。那是2002年夏天,当时的人们都抱着一份无论看见什么都如实报告的心理。现看现报,千万不要等新闻出来后再说。如果他们遇到一个棕色皮肤的人,而且知道了他的名字,他们就会聚在一起讨论:‘那是什么名字?听起来应该是阿拉伯人,他一定藏有炸药!’

“那对夫妇并没有恶意,也并非小人,而且跟我也无冤无仇,他们只是觉得有必要这么做。”

不到10分钟,哈桑就意识到了这些。不过,尽管名字听起来很像阿拉伯人,哈桑绝对不是基地组织成员。出生于孟加拉国的他操着一口稍带纽约口音的英语,那是因为他7岁的时候就到了布鲁克林,并在那里度过了自己的童年。没错,他是棕色皮肤,但那一头金黄色的头发表明他绝不是异教徒。他只是一个普通的移民二代,一个说美国英语、生活在美国、感受着美国文化的邻家男孩。没花多长时间,联邦调查局探员就弄清了这一点,然后就让哈桑乘飞机回坦帕了。

正常情况下,故事到这儿也就告一段落了,但“9·11”之后的世界可没有什么正常可言。如果你有一个“哈桑”这样的名字,而且还是棕色皮肤的话,就算你是佛罗里达州唯一一个没有枪支弹药的人也不管用。所以,在接下来的5个月里,哈桑不得不频频出入坦帕的联邦调查局,而且每次都会被查问数小时。

“基本上,我把我人生中经历的所有事情的细枝末节都告诉了他们,没有一丝隐瞒。”他回忆道,声音中没有任何怨恼之气。“你知道,当跟那些掌握着你生死大权的人面对面坐着的时候,你似乎失去了理性。你觉得自己应该做些什么,但却又什么也不敢做。”

5个月后,也就是感恩节过后没多久,经过一轮烦琐苛刻的测谎程序,一个短头发的大块头探员告诉哈桑,一切都结束了,他自由了。这让哈桑大吃一惊。就这样?就这么结束了?就像过去5个月什么事情都没发生过一样?他看着探员说:“等一下,伙计,我马上又要出国了,回来的路上不会又发生什么吧?”

“你要去哪儿?”

“印尼。”

“哦,你要多加小心,那儿发生过恐怖袭击。”探员关切地看着他。

哈桑对这种莫名其妙的变化感到很诧异。经历了种种之后,他心想,这家伙肯定是在跟他开玩笑。不过,探员看起来真的很担心他,所以哈桑决定坦率地说出自己的想法。

你瞧,伙计,我最害怕的不是飞机失事或是大厦爆炸。我最怕的是你们中有人自以为所做的一切都是对的,然后随意把我带走。一旦这样的事情发生,没人知道我在哪儿,也没有人知道该怎样把我从困境中救出来。

就在美国开始把从世界各地抓来的犯人关进位于古巴的关塔那摩监狱的当下,哈桑知道那位探员会懂他的意思,而且他是真有这样的担忧。虽然探员什么都没说,但他的肢体语言和表情告诉哈桑:没错,这样的事情确实会发生,我也很替你担心。受到鼓励的哈桑紧接着说:“我们需要的只是不要让这次的事情重演。那么,我现在该怎么做呢?”

探员想了一会儿,然后掏出钱包,拿出一张卡片给哈桑,说:“上面有一些电话号码,如果你遇到麻烦,就打电话给我们。”他稍稍停顿了一下又说:“我们会马上处理,而且一定在第一时间赶到。”

哈桑看了看那张卡片,又看了看探员,如释重负地说:“太好了。”最后,他还逗趣地说了句:“哇哦,我请到了最佳的保镖。”

数据,让一切成为可能

现如今我们享有的众多先进技术,如电脑、手机、太空旅行以及各种新药物,都建立在数百年来的科学探求的基础之上。而在这一过程中,驱使人们不懈努力的是一个从未动摇过的信念:自然现象能够被人类理解、描绘、量化和预测,并最终受人的控制。大部分人对科学很是痴迷,而抱有这份信念的好处在我们身边随处可见。

我们学会了控制半导体中的电流,制造出了晶体管收音机和iPod音乐播放器;我们破译了无线电波的规律,使得人们可以通过手机进行无线通话;我们掌握了人体中众多化学物质的作用,为治疗日常疾病提供了线索;我们还发现了万有引力定律,让去月球旅行成为了可能。

遗憾的是,这种富于启发性的革新仅仅停留在了自然科学领域,在人们日益关注的地方却止步不前,那就是个人以及人类社会的行为。一旦涉及人类行为,我们日常所见的一系列事件就像15世纪人们眼中的行星运动一样神秘莫测。

在日常生活中,虽然我们可以针对某些事情自由做决定,但似乎人生的大部分时光还是处于“无人驾驶”状态。人类社会从资源丰富走向资源匮乏,从战争回归和平,又在和平中爆发战争。这一切不禁引起大家的思索:人类发展究竟有没有遵循潜在的规律,遵循那些并非人类自创的规律?

哈桑的故事就是个很好的例证:他与联邦调查局的冲突是出于偶然,还是可以从肤色、名字以及最重要的行为举止上预见?他的经历是否符合能被社会接纳的一般规律和结果?那对来自肯塔基州的夫妇是否只是通过臆断就恰好堕入了爱国主义和后“9·11”恐惧心理交织的复杂大网之中?人类的行为是否受一系列法则和原理控制,而这些法则又刚好如牛顿万有引力定律那样富有预见力?天哪,我们能否走到可以预知人类行为的那天?

到目前为止,问题的答案只有一个:不知道。其结果是,虽然如今我们对木星有了进一步的了解;能够预测电子的移动方向;可以偶尔来个转基因实验;甚至能将机器人送往火星。但是,一被问起是否能够解释或预测人类的行为,大家都还是一头雾水。

原因很简单:过去我们没有相关数据,也没有一定的方法来探究人类的行为。实际上,当我们把细菌放在显微镜下观察的时候,它们不会生我们的气;月亮也不会因为我们在它上面停驻宇宙飞船而投诉我们。然而,人类不会跟细菌和月亮一样不在意我们孜孜不倦的探查,也不会欣然接受一些侵犯性调查。

不过,有一个人例外。

从被监视者到自我监视者

鉴于对安全的新认识,哈桑养成了一个新习惯。

在每次出国之前,他都会打电话给那位探员,告知自己的旅行计划。“也不是一定要打电话给他,只是我自己想要这么做。我想让他知道我会到哪儿去,会做什么事儿,”他解释道,“当然,我不会有什么出人意料的举动,我可不想引起他们的注意。”

随着时间的推移,他开始将联络方式由电话换成邮件,而且经常发一些旅行照片和简短说明。渐渐地,那位大块头的探员对哈桑来说不仅仅是一个执法者了。哈桑开始把他当成自己私人的联邦探员,而这位“保镖”也在履行诺言——哈桑虽各地游走,却再也没受过骚扰。

然而,距底特律大都会国际机场事件一年半后——在这段时间里,哈桑已经发了无数行程表和旅行照片给联邦调查局,2004年1月,哈桑有了新想法:为什么只跟联邦调查局分享自己的旅行信息呢?为什么不让所有人都知道?

“要是有人搞错了,或是某些事儿出了差错怎么办?”他这样问自己,“虽然那些家伙已经对我了如指掌,但他们得到的信息到底有多详细呢?他们肯定会漏掉一些东西。”

“自从有了这些顾虑,我就给自己建了一个并行数据库,以复原我的联邦调查局档案。其实,不只是复原,而是重建一份比他们的档案精确度高得多的档案。”

他开始在自己创建的网站上传照片,并设置流动坐标。这个习惯很快变成一种痴迷并延续至今。实际上,如果你打开www.trackingtransience. net,就能看到首页地图上有个红色箭头在闪动,它能告诉你哈桑目前的下落,而网站上的照片可以让你一瞥他所在之地的风情,照片中的可能是旅馆房间、咖啡屋,或是机场。点击地图下面的一系列图标,你就能看到一个包含3万张照片以及他所到之处的场景图的文件夹,里面从餐点照片到他用过的小便池的照片,从完整的航班号目录照片到详细的账单照片,应有尽有。

为了确保所有信息都能公开,他把监视视角颠倒了过来,将自己由被监视者变成了监视者。现在,他既是嫌疑人又是联邦探员,并代表联邦调查局对自己进行实时追踪。

爆发洞察

至此,隐私权的概念对哈桑已经完全不适用了。他变成了一个一举一动都受大家监视的特殊标本。他的生活成了他最大的艺术品,一直延续,没有尽头,而其中的一部分已经被展示在世界各地的博物馆、展厅以及画廊中了。

他的这件艺术品极具偶然性,一路走下来,总有一些事情他无法预知。通过记录并公开自己的行动和下落,哈桑为科学探究活动中最受人忽视的领域提供了非常详细的实时信息资料,而颇具讽刺意味的是,这个实验的对象就是他自己——哈桑伊拉希。

大数据时代的大机遇

不过,哈桑并不孤单。

爆发实践

十年前,微软实验室的高级研究员戈登·贝尔(Gordon Bell)戈登·贝尔和吉姆·格默尔(Jim Gemmell)合著《Total Recall: How the E-Memory Revolution Will Change Everything》一书中文版即将由湛庐文化策划出版。——编者注就开始随身携带一个能够自动拍下他眼前每个人照片的数码相机,以及一个能够随意捕捉身边大范围内的各种声响的录音机。同时,他还建立了一个数字指纹库,用来存储他有意无意间接触到的所有事物,并将其归档。在过去十年中,这个数据库中的信息量与日俱增,已保存了10万封电子邮件,数万张照片,他的所有通话录音、近千张病历以及他读过的每一本书,甚至还有他品尝过的每种葡萄酒的商标图片。

同样,麻省理工学院媒体实验室的计算机学家德布·罗伊(Deb Roy)在他儿子出生前,就在家里安装了11个摄像头和14个麦克风,记录下家中发生的一切,并将所有记录都通过电缆传输到地下室里存储量为一百万兆字节的磁盘阵列中。磁盘存储了他儿子的每次欢声笑语、每回换尿片的样子,以及他与妻子的每次畅谈和争吵。目前,磁盘中已经积累了25万小时的音像资料。

对我们这些没有伊拉希、贝尔或是罗伊那样偏执,也没有太多资源的人来说,有股更强大的力量在对我们施加影响:我们正处于一种不断变化但却日趋精密的被监视状态中。事实上,现在我们的一举一动都能在某个数据库中找到线索。

我们的电子邮件都保存在电邮供应商的日志文件中;我们的通话记录都被加上时间标记备份在电话公司的大容量硬盘上;我们何时何地买了什么东西,我们的喜好、品味以及支付能力都被信用卡提供商编目归档;我们所有的个人网页、空间、facebook文件,还有博客的信息都被保存在多个服务器上;我们的即时行踪完全被手机供应商掌握;我们的容貌和穿着打扮都被安装在各大商场和街角的摄像头捕捉并记录。虽然我们通常选择不去多想,但事实上,我们的生活完全能被这些雨后春笋般出现的数据库所记录的信息串联起来。

毫无疑问,正是这些记录的存在引爆了个人隐私危机,而这一问题的严重性再怎么夸大也不为过。然而,它同时也创造了一个历史机遇——它第一次毫无偏见地为我们提供了成千上万人,而不是少数人的详细行为记录。在过去几年里,这些数据库为各大实验室提供了不少帮助,使很多计算机学家、物理学家、数学家、社会学家、心理学家以及经济学家得以在强大的计算机和新技术的支持下,对某些问题进行仔细研究。实验的结果令人振奋。他们有充分的证据证明,人类的大部分行为都受制于规律、模型以及原理法则,而且它们的可重现性和可预测性与自然科学不相上下。这些发现并不只是科学家在纸上谈兵,其中一些模型和原理已经价值数亿,像谷歌和雅虎这样以追踪人类行为为商业模式的公司都身价不菲。可以说,它们颠倒了乾坤。在过去,如果想了解人类的行为和想法,你必须去考个心理学家证书,但现在,你可能需要先拿到计算机专业的学位。

爆发洞察

现在,本书的根本目标就浮出了水面。我会向大家展示,在日趋精密的数字技术创造的这个巨大、复杂而又翔实,并且超越以往任何科技水平的研究实验室面前,人类赤裸裸的一面。通过对这些发现进行追踪研究,大家会看到生命的韵律,会发现人类行为中更深层次的规律,并确证这些行为是能够被探究、被预测,而且无疑是能够为人所用的。

有了这些四处搜集来的信息,我们不会再把人类的行为视为互不相关、随意偶然的独立事件。相反,它们应该是相互依存的奇妙大网的一部分,是相互串联的故事集中的一个片段。它们会在不经意时显示次序,在意想不到之处偶然出现。我们观察得越仔细就越容易发现,人类行为遵循着一套简单并可重复的模型,而这些模型则受制于更加广泛的规律。

忘掉那些将生命看做掷骰子或是巧克力盒的比喻吧,把自己想象成处于自动驾驶状态、做着美梦的机器人,你就会更加接近真相。

历史韵律背后的深意

尽管开篇我讲述了哈桑的故事,但本书最终的主角不是哈桑,也不是美国国土安全部。我是想说明,在人类行为的问题上,哪些是普通的,哪些是特殊的。

不过,要说明这个问题,在接下来的章节中我们还是会提到哈桑以及他与联邦调查局之间的故事。我们将看到,刚开始,那名探员为他提供的保护还管用,但没过多久,当政府不再信任由狂热的市民自己追踪罪犯的时候,他的方法就失效了。要想弄懂哈桑为什么会被在世界各地以反恐名义布下天罗地网的美国政府扣押,我们需要仔细研究他个人网页上的信息,并且将他的行为与世界上成千上万的其他人做比较。结果会令人吃惊吗?从某个角度上看,美国国土安全部做得对——至少,他们发现了哈桑行为的不同寻常之处。哈桑是一个十足的异类,这一发现对我们来说非常重要,因为一说起他的行为,本书所总结的很多人类行为的一般模型都不再适用了。

然而,哈桑并不是本书提到的唯一一个异类。我们还会追溯到路德 Luther,公元15世纪至16世纪抗议罗马天主教会的传教士。——编者注、哥白尼以及米开朗基罗生活的时代,带领大家重回人类生活与占星学、奇迹、巫术、鬼魂、精灵以及预言紧密联系的年代。我们这么做的原因,就是要追踪一系列与当代人哈桑的旅程一样奇妙的事件。在这个过程中,我们会遇到另一个异类,一个被同时代人称为乔治·塞克勒(Gy rgy Székely)的人。

但事实上,他家乡的人们并不叫他塞克勒。跟其他一些游历世界各地的人一样,他的名字来自于他的故乡——一个难以捉摸的匈牙利语部落,当地的塞克勒人自称为匈奴王阿提拉的后人。他们居住在特兰西瓦尼亚东部的,令人叹为观止的喀尔巴阡山上——那里正是布拉姆·斯托克(Bram Stoker)笔下的吸血鬼德拉库拉伯爵的居住地,也恰巧是我的出生地。

随着对科学和历史的深入了解,我们会发现,跟哈桑一样,乔治·塞克勒在很多方面都很普通。不过,他对反复无常的历史通常有独特的、令人难以捉摸的反应,这使他最终带领一支教皇的十字军,在根本没接近敌人的情况下就大败敌军。

不过,不仅仅是乔治·塞克勒与众不同的一面吸引了我们,更让我们着迷的是,他每次力挽狂澜改变历史的事迹都被一个与他同时代的人预测到了。这么看来,他好像跟你我以及身边所有人一样完完全全被看透了——好吧,哈桑除外。现在,我们要想知道一个人的下落,可以依靠能够每时每刻监视我们的尖端科技,但是要想在16世纪预测战况,判断教皇、红衣主教以及士兵们的行动可就没那么容易了。那么,为什么有人在遥远的16世纪就对他祖国的命运有如此精确的预见?

马克·吐温曾说过:历史不会重演,却自有其韵律。让我们来聆听这韵律,让哈桑·伊拉希、乔治·塞克勒、你和我,以及身边成千上万人之间存在的明显差异,指引我们发现人类行为背后的深意。诚然,不管生命中的小细节多么迷人,科学在实验室中发现普遍和一般规律的能力仍然闪耀着光辉。至于人类的行为,那只是我们的一种追求,是我们对大千世界的一瞥。