推荐序II
科学技术的危机
《卫报》
一位数学家认为,算法无法操控我们,因为我们远比算法聪明。但数学没有道破我们所面临的危机。
偏见、排名和假新闻
道格拉斯·亚当斯(Douglas Adams)在《银河系漫游指南》一书中写道:“宇宙浩瀚无垠,广阔得让你难以置信、叹为观止。你可能会觉得去药店的路远得走不到头,但我告诉你,这段距离在宇宙中微不足道。”在我读萨普特的这本书时,亚当斯的话不断在我脑海中回响。
本书旨在对管理着我们数字生活的系统的全貌一探究竟。仅仅是几组简单的数字就足以让你晕头转向:脸书拥有 20 亿用户,他们每小时会写下上千万篇帖子,还有数以百万计的照片、点赞和互相关注,脸书利用这些数据在数百个的维度上对我们进行建模。在这种模型面前,我们人类的大脑显得微不足道,因为我们的大脑最多只能具象化四个维度。
同样地,谷歌翻译(Google Translate)的系统能将几百种语言分解成多维词义矩阵,这些矩阵会创造出我们无法理解的、只属于它们自己的形而上语言,并将各种语言的内隐偏见包含其中。
这些系统的设计初衷是理解词语和概念之间的相互关系,然而我们在其中输入英国最常用的婴儿名字时,将会得到这样的答案:“奥利弗之于聪明正如奥莉薇娅之于轻浮。”作者由此表达了他的担忧:“我们后代的性别角色已经被算法提前设定好了。”
作为一位应用数学教授,萨普特对此类问题的本能反应是在数学模型中对它们进行重建,然后消除导致这些问题的因素。在这个过程中,我们对算法难以言喻的恐惧或许能够得到缓解。他使用了大量论文中的原始数据,抽丝剥茧地解开了这些系统背后的数学秘密,清晰地向我们展示了这些看起来十分高级的运算,这些运算控制着系统输出的结果,同时也制约着这些系统本身。
采用复杂的回归模型拟合脸书的数十亿个“赞”,这种做法本身无可指摘,但其结果却并不那么值得称道:没错,“民主党人士比共和党人士更有可能喜欢哈利·波特(Harry Potter)”,但“这并不一定意味着其他哈利·波特粉丝都是民主党人士”。
作者采用同样严肃的方法颠覆了那些我们懒于认真思考的常见论断:我们都在被假新闻愚弄、被困在不断强化偏见的过滤气泡中难以脱身等。我们显然还没有愚蠢到看不出问题的地步。
并非只有所谓的“社交媒体傻瓜”在承受这种压力。萨普特不断以其他系统作为例证,粉碎了当前社交媒体将悲哀都归咎于脸书等网络巨头的谬论。作为学术论文搜索引擎的谷歌学术(Google Scholar)也会根据每篇论文的被引用次数来对其学术影响力进行排名,致使人们对热门的研究领域趋之若鹜,科研经费也一哄而上投入其中,而那些真正可能改变世界的研究却可能因为没有足够的资金支持而止步不前,甚至胎死腹中。在线预测市场中的那些所谓的专家也只不过是滥竽充数,其预测水平和普通人并无差别,得出的投票预测数据和胡猜没什么区别。
萨普特举了一个又一个例子,旨在告诉我们,不管是在精英群体中还是在更易接近但自我意识稍弱的普通民众中,过滤气泡、肤浅的排序机制和算法推荐的毒害都有迹可循。然而,它们的危害程度并不像媒体向我们灌输的那么严重:“只要有时间,我们科学家仍然可以把研究做好。我遇到的大多数科学家都是出于对真理的永恒追求和对正确答案的真切渴望而献身科学的。”
复杂系统自有它的局限性
本书的面世适逢其时,书中的调查研究让作者早在公众对剑桥分析公司(Cambridge Analytica)的愤怒彻底爆发之前,就开始质疑这家企业的角色,并且想尽办法采访到了该公司的首席研究员亚历山大·科岗(Alexander Kogan)。作者最终认为剑桥分析公司在美国大选中所起的作用微不足道。他写道,我们之所以相信剑桥分析公司的方法行之有效,更多的是因为我们相信了该公司管理层的夸张宣传,而并不关心其背后的数学支持是否牢固可靠。
但是仅仅关注数学本身会使我们片面地看待这些新兴的复杂系统在日常生活中所起的作用。作者深度探究了美国和法国选举期间的假新闻背后的数学逻辑,以及机器人在英国脱欧公投中扮演的角色,却忽略了更值得我们担忧的问题,比如肯尼亚、斯里兰卡或缅甸等国家的网络仇恨言论所带来的影响。后者不是误用数学的结果,而是这一趋势的后果:由于技术决定论造成的文化盲区,人们只关注主流社会和发达国家,却对第三世界的情况视而不见。
脸书和谷歌的研发人员拥有美好的初衷,他们相信在一种情境下能有效运行的算法到了另外一种情境下同样会有效运行,但他们未能预见这些平台会被别有用心的政治煽动者利用,或者被用来监控整个国家、审查每个网民。凡此种种,都让人不得不怀疑:也许我们遭遇的算法危机根本就不只是一个数学问题。
当然数学家们也不难意识到这一点,而且萨普特还煞费苦心地强调了自己作为数学家的优势和局限性。他的上一本书《足球数学》(Soccermatics)带领我们在美妙的足球运动所蕴藏的数学逻辑中进行了一次引人入胜的有趣探索。但我们都知道,足球毕竟只是一项体育运动,尽管充满了喧嚣与愤怒、机会与混乱,但它终归还是由两个半球缝合而成的,它的目标只有一个,那就是进球。量化球场上发生的事情虽然有些难度,但很可行。可球场外所发生的事件无法被量化,而相信可以量化的人也遭遇了数不胜数的意外后果。
尽管萨普特一直坚持认为,在当今的算法系统中,人类的监管必不可少,但他的分析似乎无法解释捣蛋鬼的行为,以及那些无视所有证据,继续生活在阴谋论、偏见和权力欲中的人的行为。正如一位研究人员指出的那样,对于语言翻译系统中的偏见,“如果不首先解决现实社会中的种族主义和性别歧视,就没有办法真正解决由无监督学习造成的问题”。
在本书的开头,有一段简短的文字提到了谷歌开发的一款能在YouTube上生成定向广告的软件。这款软件可以让品牌根据用户的个人资料在视频中插入文字和图片,将其广告生成为无数种不同版本,进而增强品牌的影响力。这款软件的名字叫沃冈(Vogon)——毫无疑问这是道格拉斯·亚当斯创造的,他用这个名字来称呼那些要毁灭地球的像鼻涕虫一样的外星人:“沃冈人是银河系中最不令人愉快的种族之一,但事实上他们并非邪恶的种族,而是脾气暴躁、官僚作风严重、爱管闲事并且冷酷无情的种族。”
理解这些复杂系统背后的数学原理会让你受益良多,而作者真诚的叙述同样揭示了它们的局限性。但是,再多的数学知识也无法帮助我们重新获得日渐失去的生活主动权,也无法击败那些故意利用数学的复杂性来对付我们的人。