新未来简史:区块链、人工智能、大数据陷阱与数字化生活
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

算法“马甲”,误解、失控与智能

算法是科技的核心要素之一,而科技决定着人类的未来,很有必要深入探讨一下。

算法被如今一些人误解,是因为时髦的“大数据”兴起后,让人产生了丰富的联想。当然,前提是一些人过度将特定领域的“算法”与日常“大数据”连在了一起,这本身就导致了很深的误解,直接原因还要追溯到对“大数据”认识的两大误区。

误区之一:有人认为如今和未来的大数据将会越来越多,这是不完全正确的。上一节已经谈到,世间万物,不论是人工的还是自然的,从古至今,它们都在不停释放“巨量”的数据,只是过去的人们没有办法能够感知到更多而已。如今通过互联网、物联网等感知到的被人们称为“大数据”的数据(主要指人类信息交换、信息存储、信息处理三方面能力大幅提升后,人与人、人与物之间所制造的数据),相对于万物在同一时刻所释放的所有数据来说,只是微不足道的“微数据”而已。

误区之二:混淆大数据的“深”与“广”。这需要深入讨论,因为它与人们对“算法”的认知与误解有很大的关系。

物联网从理论上来说,可以将世界上的任何物品,甚至一颗沙粒都链接进入网络,范围非常广泛。但是,就具体被链接的物品来说,收集的信息大多都是浅层次的。例如,西伯利亚雪地里某处石油管道是否正常、过油量及是否存在损坏的数据;青藏高原无人区某处火车铁轨下冻土层是否存在融化危险的适时数据;商场所有商品数量变化及其补货需求、是否存在霉变等及时数据;个体和群体日常生活中的消费趋向、资金动向、行动习惯、体质指标等变动数据。这些数据收集的目的很明确,大多与及时的实用性有关:油管、铁轨监测以便预防风险,商品数据有利于现场管理与销售,个体、群体数据便于准确区分消费阶层,主要为商家、政府或医疗等机构提供管理监测、定向促销或较粗浅的健康、心理和行为研究等服务。

大数据中的“大”,主要是指事物的“范围”。这些大数据,对生命运行、生物机制、智能模式与意识的理解等深层次研究和相关“算法”的开创等没有太大关系,当然,对人类未来,诸如生命、机理、智能等的控制也没有太大的关系。

现实中,一些未来学家将如今时髦的“大数据”与人类存亡的“算法”联系了起来,他们认为,从长远来看,诸如亚马逊、Facebook、Google等科技巨头与政府机构从人们身上收集来的数据,积累到足够庞大的量以后,就能开发出比人们自身更了解自己的算法,并因而能够操纵人们的决定及行为,甚至能直接入侵人性、意识,重组人类社会甚至控制生命本身,进而成为主宰人类的少数派等。这听起来确实很恐怖。下面结合上述人们对如今大数据与算法的误解,进行简易分析。

诸如Google、Facebook、亚马逊及政府机构等的“大数据”仅仅是对人们工作、学习、生活、休闲、消费、健康及喜好等因素及其这些因素之间或与其他物体之间的互动所产生的及时数据的跟踪和收集。本书把这些数据称为万物(主要局限于人与人、人与物之间)的外在“表数据”。

让人容易忽视的是:在这些行为、喜好与互动之下,人们复杂的思想数据,数以亿计的脑细胞间的交流数据与生化反应的数据,以及它们之间或与人体健康、心情等联动的综合数据,那些微小、复杂到深入基因、细胞,以此牵引器官、肢体的运行数据,互动激发与再互动、再引发的数以亿计的数据,综合表现为思绪、情感、逻辑、判断、选择等数据,以及其之间在宏观与微观层面联动出的亿万关系和微妙反应等数据,由此所产生的数以亿计的浩如星河般的天文数据。本书把这类数据称为万物的内在“宏数据”。

也就是说,存在这样的情况:你挥一挥手这个简单的动作,如果深入到器官、组织、细胞,分子、粒子等层面,它们之间所发生的各种生化反应、能量消长、杂沓运动、神经协同、信息传输的联络、冲突等个体、集成与交互的数据总和,可能比第二次世界大战发生的所有人类冲突、联系都还要多,还要复杂。然而,对于这一动作,日常概念下的“大数据”,只能收集“几个不起眼动作”的数据而已,要想深入机体、器官、组织内部观察那数以亿的真正“大数据”,恐怕未来数十年、数百年都难以实现,更不用说收集了。

由上分析,我们做个类比。这里把Google、Facebook等用以开发众多“算法”的“大数据”(上文命名的表数据)比喻成一粒芝麻的话,那么,操控人们生命、意识与行为等的“宏数据”则可能大如太阳系了。在实践中,用一粒芝麻的数据去推断芝麻的根茎、植株的性能都是“不可实现”的学术与研究,更不用说用一粒芝麻的数据所研发出的“算法”去推导、掌控整个地球或太阳的性能与运行。看来,那些认为Google、Facebook等未来将会掌控人们意识、行为和生命的观点,是不是类似在说,你只要掌握了一粒芝麻的数据,就可以研究出理解、控制整个太阳系的“算法”了呢?我们抛开那些让人迷离的、浮华的语言和联想,沉浸下去,努力去靠近实质,你是不是会突然发现,这是多么天真而伟大的“天方夜谭”啊!

“表数据”需要将世间万物链接进互联网,需要纵横天地、遨游四海的“宏大”场面和气势,然而,“宏数据”则只需要潜入到某个具体的点,深深地发掘下去,数年、数十年、上百年,越深越好,“场面”非常简单,只需几个高级科学家、数十平方米的实验室和精密仪器,几只老鼠、果蝇或手指大小的大脑无数切片而已。例如,与气势磅礴的曼哈顿原子弹计划、阿波罗登月计划齐名的“人类基因组计划”,举全人类智慧,花费了近20年(从提出计划到结束)的时间才初步完成,其研究对象仅仅是微小细胞中的染色体。这个连肉眼都不能看见的物质和“场面”,与如今物联网、大数据的巨大阵势相比,到底有多么微小,而又有多么伟大呢?

所以,只有那些专注于“宏数据”的组织、机构所研究的“算法”才可能涉及对生命、机理、智能等控制的主题。当然,诸如Google、Facebook这些科技大公司也可以去设立研究“宏数据”的科技部门或机构。但是,我们必须看到:一方面,果真如此的话,它们花费了数十年收集到的这些对商业具有无限价值的表层“大数据”(借用这些数据研发的算法,大多都是商用算法))基本都用不上了。另一方面,由于远远背离了这些科技大公司运营战略、股东利益与商业价值,肯定会遭受股东会、董事会很大程度的阻击。

更为重要的是,在如今科技高速迭代发展的情况下,再了不起的公司也经不起折腾,如曾经一统天下的柯达、诺基亚,说倒就倒下了,即便是IBM这样伟大的世界性公司,也仅仅因为曾经忽视了计算机家庭化的趋势,数年之内也差点儿倒在血泊之中。所以,才有李彦宏道出“百度离破产只有30天”这句忧患而很实在的经营“箴言”。当然,诸如像Google收购“Deep mind ”、IBM的沃森研发与“百度大脑”的开发等事项,都与潜在的“巨大商用”与扩大影响力等有着重要的关系。

实际上,大脑内的一些脑细胞集群所产生的微观“宏数据”,都可能超过如今全世界所有物联网所收集到的“大数据”的总和,更不用说整个大脑了。即便是数十年、数百年之后,人类技术非常发达,或许你都难以穷尽一颗大脑内的所有微观的“宏数据”,更不用说数以亿计的万物了。所以,如今的物联网,仅仅是收集了万物外在的、浅层的“表数据”而已(当然,不排除未来往深度方面发展)。相对于万物内在的超级巨大的“宏数据”来说,差别至少在指数级别之上。

从万物内在的微观上来看,既然如此巨大的“宏数据”我们都不能感知,那如此小(相对的小,绝对数量构成了如今的“大数据”概念)而且大多很表面的“表数据”又能做什么呢?了解、跟踪一下人们的行踪、健康、生活,以此促销,研发实用性机器人,提升人们包括健康、心情和行为等在内的整体生活,这确实还可行,且其经济、实用价值与商业运营空间非常大。

若以此表面的数据,就认为“能够开发出比人们自身更了解自己的算法,进而操纵人们的决定、行为。随着数据量的积累,足够大到可能破译大脑深层机制和人类自身的身体,就会因而获得建构新生命的能力。因此,那些能够破译生物算法的巨头,终将成为生命与人类命运的主宰”等观点和看法,是不是有些“想入非非”(不深入分析,确实能够能让人深度迷惑的)了呢?

于是,有人会问,那“阿尔法狗”、无人驾驶、人脸识别等人工智能又是怎么回事呢?确实,诸如“阿尔法狗”需要用到上亿的过往顶级棋手的“棋局”数据,无人驾驶也需要数以万计的实战场景数据,人脸识别也需要数以千万的人脸图谱数据,正是这些数据的输入与训练,才让“机器”通过深度学习、“左右互搏”的增强学习或对抗性学习以达到实用要求。这些棋谱、场景与人脸特征,即使内容再多,也只是属于表层的大数据,即前述的“表数据”。收集这些数据,是诸如Google、Facebook、百度等互联网公司的“特长”,这也是它们能在发展人工智能方面具备优势的原因。

另外,任何一家大公司所获取的数据总是有一定局限性的,即便是围绕人的各类领域都不可能穷尽,更不用说其他领域了。例如,人们上厕所的习惯、对污水处理的关注、聊天与特别癖好等,未必就是Google、Facebook、百度等公司的长项了。

最为关键的是,这些人工智能技术及其日常概念下的“大数据”,都与上述“宏数据”及其涉及入侵、控制人类等的“算法”存在本质的区别,它们之间有着几乎不可跨越的“鸿沟”。

谈到这里,我们有必要回过头来,对“算法”概念与内涵进行解读。

一般在计算机领域经常用到或听到算法的概念,其是指一系列解决问题的清晰指令,代表着用系统的方法描述解决问题的策略机制。当算法突破其狭义概念向广义方向延伸后,就像很多其他被广义了的事物一样,其内涵便被赋予了无限遐想的空间。例如,“山寨”这一词汇,最早就是指占山为王,无人管辖的意思,后来却演变成“盗版、克隆、仿制”等行为的代名词。整个意思跨界般地扩容了,甚至连词性也跟着变了。当然,日常生活中,这样的事例还有很多。

于是,算法的“马甲”出现了:诸如小学学的“加法、乘法与除法”的计算法可以称为算法;不同文字组合形成一句话的造句方式也可以称为算法;甚至,有人将人类个体及其各类生物都看成算法,还说,每个动物都是各类有机算法的集合,是经过数百万年的进化与自然选择的结果。这些将“算法”的概念与内涵往外延伸的思想,确实没有什么错误和问题,但是,如果无限性地延伸的话,那将增添“浓厚的文学演绎与想象色彩”,那肯定就不是事物本身的了。

古人说,“失之毫厘,谬以千里”,何况文学演绎与想象出来的“超级比喻性”的东西呢?得出严重背离事物本身发展趋势,甚至是“南辕北辙”的结论,也就是很自然的事了。有一个著名的管理学段子,便能说明这一夸张的推演:

丢失一颗钉子,坏了一只蹄铁;坏了一只蹄铁,折了一匹战马;折了一匹战马,伤了一位骑士;伤了一位骑士,输了一场战斗;输了一场战斗,亡了一个帝国。

我们知道,一场战争的胜负,最终取决于双方的综合实力与智谋的较量,更不用说一个帝国的兴亡了。所以,上述推演根本就是“想象”中的虚幻故事。然而,即便是涉及它所隐含的“注重细节”的教义,就其“奇迹性”的本身来说,现实中还是有人相信“这是真的”,并被广泛传颂。更有甚者,干脆将上述推论的中间环节省去,直接得出“一颗钉子,毁掉一个帝国”的结论,居然还是有人相信!显然,这已经是堪比天大的“谎言”了。

既然算法并不像一些人所描述、想象的那样,可以无限度地延伸,那又将怎样去看待“算法及其联动的人工智能将会战胜人类”这类话题呢?

诸如算法、人工智能战胜人类的论断本身就是一个伪命题,或者说它们在某些方面比人厉害,根本算不了什么,用不着“大惊小怪”。在现实生活中,比人类厉害,或者说战胜人类的东西太多了。

例如,你与石头相撞,腿折了,说明石头在硬度上战胜了你;你走近一棵大树旁,抬头仰视树梢,说明树木在高度上战胜了你;你到田间去抓黄鳝,它一下钻进了水塘,你却不能,这说明黄鳝在“潜水”方面战胜了你;你到野外,看到几个屎壳郎正在牛屎里攀爬,厌恶至极,这说明屎壳郎在化解粪便的能力方面战胜了你……当然,从古至今,人们发明了无数的东西,从木棒、石器到弓箭、刀剑,从火药、枪炮到导弹、核弹;从马车、蒸汽机到汽车轮船、火车飞机,再到火箭、卫星与航天器;从笔墨纸砚到电话、收音机、计算机、手机、互联网等,这些东西无不在其一定的性能或功能上强过人类,甚至远远超过和战胜了人类。我们都不把这些放在心上,那为何还要害怕阿尔法狗这样的“人工智能”呢?

阿尔法狗下棋那么厉害,然而它连把棋子摆上棋盘这样一个简单的、低级的动作都不能完成,它与石头比你硬、树比你高,或者说原子弹比你厉害有什么区别呢?或许你会说,它的“智慧”能战胜世界顶级棋手(这根本就不是什么智慧,参见“从比喻到文化,再到恐怖崇拜”章节详解),或者说,它们有被创造出“意识”的期许。不过我们严肃地告诉你,时至今日,那些哪怕有一丁点儿意识趋向的“强人工智能”“超强人工智能”都是想象中的或科幻电影中的故事。而且,我们还发现:

很多科研机构,数十年甚至上百年对机器、生物、大脑与意识等的深入研究,虽然号称成效巨大,但是,时至今日,甚至连大脑冰山一角的几片雪花或许都还尚未触及(见“不可触碰的星河”章节详解)。正如对“谷歌大脑”“百度大脑”有着较大贡献的世界顶级人工智能专家吴恩达先生所说的那样:“虽然媒体经常渲染人工智能,但我认为离真实的人工智能还差得很远。毕竟,我们对大脑的运作原理一无所知,而盲目地让计算机复制大脑的工作状态并不能为人们带来好用的AI系统……当然,如果你听到有人说要制造一个人工大脑的话,我的建议是赶紧躲远点”《吴恩达在Quora上获得上万赞同的最高票回答,却和人工智能无关》,来源于ZOL新闻中心,2017年1月17日,http://news.zol.com.cn/624/6244967.html。

诸如阿尔法狗、无人驾驶、人脸识别等被一些人认为“远远战胜了人类”的人工智能,实际上,相对人类来说,仅仅就是一种单一维度的“超高性能”的低级能力而已(参见“几何级别的差异”章节详解),更不说人类的“意识”和思想了。什么是意识?人类还根本摸不到北(见“不可触碰的星河”章节详解)呢。

既然我们对真实的大脑、“意识”等知之如此之少,特别是“意识”,几乎难以触碰,谈何入侵人性、重组人类甚至控制生命(至少包含对物质上的大脑和精神上的“意识”的控制)本身了。即便是将来真能控制生命本身,那也是非常遥远的事情,甚至从某种角度来说,几乎都是不可能办到的事情(并非绝对,只是强调难度)。

另外,一些人还提出“意识与智能”的分离问题,这与对“算法”和“大数据”被过分延伸与夸张的道理一样,带有强烈的文学演绎成分。因为从古至今,工具(包括机器)从来就没有过意识,谈何分离呢?而且,“意识”正是那些“人工智能将统治、替代人类”这类观点的鼓吹者们所“追求或担心”机器的终极目标。

另外,你看电脑或手机,这些网页好像知道你喜欢什么一样,及时给你推荐链接;无人驾驶车好像知道你想上车,看到你提前就停了下来,这些“智能”正是人工模仿人类设计出来的程序和算法的作用,并非“意识”,更非意识与智能的分离。就像你如今拿起一张小铁板(手机)就能看到对方的表情与行为,在家中看着一块玻璃(电脑银屏)就能知晓天下大事一样。这在古人看来,是超级智能、超级“意识”甚至是超级“生命”的结果。然而,你却对古人说,不是,那是“铁块”与“玻璃”的超级智能与“意识”的分离。他们应该也会因为这个说法“新颖”和对事情本身的无知,加上对神秘性“神力”的崇拜,或许便真的相信了。

但是,新颖、神秘并不代表事实。即便是未来,我们假想“意识与智能的分离”成立(仅是假想,也有一些人用了无数的例子与道理来论证,但是,其结论与论证之间存在几乎不可逾越的大量假设),那只能表明,这样的人工智能更是工具了,更不足以担心人类被替代、被统治与被奴役的事情了,因为它们再怎么智能,却没有“如何使用智能”的意识。

“人工智能”诸如巨大的存储能力、超常的计算能力与非常的识别能力等单向的难以跨界的诸多能力,与人们数以千计、万计的诸如情感、判断、跨越无数界限的通用的学习等智能,以及借此所创造的这些智能工具和辉煌的人类文化与文明等相比,人到底比人工智能要高多少个级别呢?我们的答案是无数(参见“几何级别的差异”章节详解)。

另外,作为人类为什么要拥有那些超级的计算能力、巨量的存储能力和超常的识别能力呢?这些都是可以利用的资源和工具。利用资源与工具才是世上最伟大的智能与智慧,才是最高级的。你需要在一生中去体验那些更有价值和更具意义的事,诸如人生奋斗、困难的突破与喜怒爱乐等。如果你真的具备了这些超级能力,那么你怎么与周边的人玩耍、交往和融入这个社会呢?