生成对抗网络入门指南
上QQ阅读APP看书,第一时间看更新

第1章 人工智能入门

1.1 人工智能的历史与发展

2017年被称为“人工智能元年”,这一年,被称为“人类最后的希望”的围棋天才柯洁与AlphaGo的进阶版Master鏖战三轮,最终以总比分0∶3败于AlphaGo(见图1-1)。这是谷歌DeepMind团队的AlphaGo深度学习的第二次亮相。也是这一年,据PitchBook统计,全球人工智能和机器学习领域共获得风险投资超过108亿美元,而2010年才不足5亿美元。也是这一年,“得AI人才者得天下”,在美国,深度学习领域的人工智能博士生都已被Google、Facebook、亚马逊、微软、英特尔席卷一空,AI人才的起步年薪达到百万。一时间,仿佛身边的人都开始习惯性地讨论几句“人和机器谁更厉害”的话题。

图1-1 柯洁惜败Master,泪洒现场

人工智能的热浪乘风而上,技术圈和投资界欢欣鼓舞,似乎一个可以媲美100年前的电力、20年前的互联网的机会正在到来(见图1-2)。但真正了解这个领域的学术圈却保持镇定,因为这个蛰伏了大半个世纪的复杂学科,早已经历了一次又一次的繁荣与低谷,2017年也许是新一轮的波峰。

图1-2 2017年美国人工智能投资爆发

古希腊诗人荷马在公元前8世纪曾描述过“锻造之神”赫菲斯托斯https://baike.baidu.com/item/赫菲斯托斯/2604787,《伊利亚特》史诗中写到他曾经设计并制作了一组金制的女机器人,这些机器人可以帮助他在铁匠铺做事,甚至能开口说话,并完成很多高难度工作。这可能是能够追溯到的最早的人工智能诞生的传说,人们开始想着不再仅仅把创造力放在静物上,而是有自我意识的个体,这是思维的突破,是最本质的变化。

稍微对人工智能有所了解的人都知道图灵(见图1-3)。艾伦·麦席森·图灵(Alan Mathison Turing),距离我们大半个世纪前的英国数学家,被称为“计算机科学之父”,又被称为“人工智能之父”。至今,图灵奖(A. M. Turing award)作为“计算机界的诺贝尔奖”,依旧是最负盛名、最崇高的奖项。“如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有智能。”这就是里程碑式的人工智能图灵测试。

其实在图灵测试提出前,其他学科上伟大的突围同样为人工智能学科的建立奠定了坚实的理论基础。人工智能简而言之是打造“人工大脑”,那么有三个问题需要解答。

图1-3 图灵

● 大脑是如何运转的?

● 大脑的运行机制是否可以拆分成差异性极低的可衡量单元?

● 是否有其他人工产物可以等价体现这一单元粒度的价值或功能?

其中,第二个问题由神经学家揭开谜团,第三个问题由信息学家给出答案,第一个问题至今仍在探索。

1.1.1 人工智能的诞生

1872年在意大利的阿比亚泰格拉索疗养院里,29岁的卡米洛·高尔基(Camillo Golgi)在一次意外中创建了铬酸盐-硝酸银染色法。在相隔1300公里的西班牙,一位同样年轻的神经学家圣地亚哥·拉蒙-卡哈尔(Santiago Ramón Y Cajal)借助这种技术,在1888年发表了单个神经细胞存在的证据,由此创建了神经元理论,被后世认为是现代神经科学的起源。这两位在1906年获得了诺贝尔生理学或医学奖。http://daixiaoyu.com/ai-3.html

神经系统由神经元(见图1-4)这样的基本单位构成,其激励电平只存在“有”和“无”两种状态,不存在中间状态。神经元二元论的观察和电子信号的0和1之间竟有如此美妙的契合度,当然这个时候数字信号的二进制还没有提出。另一个观察是神经信号的传导大多是单向的,由树突到神经元细胞体再到轴突。基于简单的两个规律,神经网络的雏形已经跃然纸上,如果我们现在乘坐“时光机”回去,肯定会站在上帝视角疯狂吼叫:“结合起来!这就是神经网络!我们可以做人造大脑了!”但科学研究的步伐何其艰难,这临门一脚的突破蛰伏了50多年。

图1-4 神经元

在50多年后的1940年,受神经学科奠基理论影响的42岁的沃伦·麦卡洛克(Warren McCulloch)和刚满18岁的“罗素信徒”沃尔特·皮茨(Walter Pitts)相遇,3年后他们提出将数学和算法结合,建立了神经网络和数学模型(见图1-5),模仿人类的思维活动,从此划开现代深度学习的序章。

图1-5 神经元模型

至此,神经元作为可拆分的差异性极低的可衡量单元出现,并通过麦卡洛克和皮茨的努力,可以用数理化的方式进行描述。但存在于纸面算法的逻辑如何变成真正可执行的工程产物?克劳德·艾尔伍德·香农(Claude Elwood Shannon,信息论创始人)对继电器的全新解读登场了(见图1-6)。

图1-6 香农利用继电器完成老鼠自助走迷宫实验

继电器是一种电子控制器件,通过电磁铁来吸引一块铁片,以控制线路的开关。如果电源没有接通,信息的流通量为0,如果电源接通,绝对理想情况下信息全部输送。香农在《继电器与开关电路的符号分析》中将逻辑代数的思想运用到了电路的设计上,用电子开关模拟布尔逻辑运算,解决了实际问题。

至此,“是否有其他人工产物可以等价体现这一单元粒度的价值或功能”这一问题也有了答案:继电器或者晶体管,或者任何能够输出0和1这两个信息符号的组件,都可以成为承载人工大脑信息传输的载体。

1943年,图灵拜访贝尔实验室,与香农共进午餐,讨论人造思维机器的设想,大有英雄所见略同之感。1950年,图灵提出一个关于判断机器是否能够思考的著名试验:“如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有智能。”

图灵测试至今也很少完整地应用于辨别人类和机器,原因很简单:机器还无法蒙混过关。但在一些影视作品里面可以看到完整的应用。1982年上映的《银翼杀手》被视为有史以来最佳科幻电影之一,里面有一段经典的测试,叫作维特甘测试(Voight-Kampff test)。为了区分人类和复制人,会进行类似于“图灵测试”的检验—被试者会被询问几十个不同的问题,检测机器会通过查看他们的眼球运动等生理活动判断是否符合人类的正常反应,或者通过观测他们的回答方式、身体动作和即时反应来区分是否是真实人类。大部分复制人在这样的测试下很快就会露出马脚巴塞君的文章,见知乎,https://zhuanlan.zhihu.com/p/30574732。感兴趣的读者可以去看看这部电影,见图1-7。

图1-7 《银翼杀手》中的维特甘测试

1956年Dartmouth会议历经两个月的激烈讨论,提出“人工智能”这一名称,以及对应的学科任务。此会议也被称为人工智能正式诞生的一大标志。至此,人工智能作为一个令人痴迷的科学学科正式登上历史舞台。

1.1.2 人工智能的两起两落

从1956年开始,人工智能的研究进入全盛时代,至此开始的十年也称为“黄金十年”。这十年有很多成功的AI程序和新的研究方向出现,包括推理搜索的算法研究、自然语言处理、微世界研究等。AI学者构造出了一系列计算机程序。当时,人工智能研究者甚至认为:“二十年内,机器将能完成人能做到的一切工作”;“在三到八年的时间里我们将得到一台具有人类平均智能的机器”。https://sites.google.com/site/lessonofartificialintelligence/

然而好景不长,很快到了20世纪70年代,盛极一时的学术圈“宠儿”人工智能开始遭受如潮的质疑和批评。人们渐渐发现仅仅具有逻辑推理能力远远不能实现人工智能,许多难题并没有随着时间推移而被解决,很多AI系统一直停留在“玩具”阶段。1974~1980年是人工智能研究的第一个“寒冬”,研究者的理论方向漫无目的是因素之一,更大的原因在于当时落后的计算机运算能力和数据收集能力。当时上限48KB内存的第四代计算机只能允许用一个含二十个单词的词汇表来演示在自然语言方面的研究结果,计算机离智能的要求还差上百万倍。

很快,对AI提供资助的机构(如英国政府、DARPA和NRC)开始逐渐停止了资助,AI研究者也遭到了学术圈的冷遇。在此阶段,学者内部也对人工智能的研究本质产生了争执,并逐渐划分为认为人工智能应该是解题机器的简约派和坚持AI应具有与人类一样的非逻辑性联想能力的芜杂派(the scruffies)。

1980年,简约派的研究成果之一“专家系统”面市,这是人工智能的一个研究分支,它具有一种仿真决策能力。卡内基·梅隆大学为DEC(一家数字设备公司)设计并制造出一个专家系统,命名为XCON。DEC的VAX型计算机可以根据用户的需求组装不同的组件,有很多销售人员并不是技术专家,所以难免出现配件购买错误的问题。XCON支持自动选择组件,从1980年到1986年,每年为公司省下四千万美元。一直被称为研究玩具的人工智能因此扫除颓势,进而获得了1980年到1987年的第二个繁荣发展期。

许多公司纷纷效仿,开始研发和应用专家系统。知识工程作为专家系统的基础,也成为当时AI研究的热门方向。紧接着,日本提出第五代计算机计划,注入大量的人才和财力,旨在创造出能够与人交流、翻译各国语言、识别图像、具有一定推理逻辑能力的机器系统。也在同样的时期,David Rumelhart提出著名的反向传播算法(BP算法),解决了多层神经网络学习过程中遇到的诸多问题。由于这个算法的提出,神经网络开始作为主流算法广泛应用于机器学习的各大领域,比如模式识别、预测和智能控制等https://zhuanlan.zhihu.com/p/25774614。AI迎来了又一轮高潮。

然而泡沫的破灭就在顷刻之间,人工智能研究的第二个寒冬伴随着个人消费电脑的快速崛起而到来http://intl.ce.cn/specials/zxgjzh/201610/31/t20161031_17368008.shtml。从1987年到1993年,短短6年时间,苹果和IBM在PC市场的发力为人们带来便捷计算工具的同时,却为高昂的Lisp电脑带来巨大的生存压力。而后者作为人工智能硬件的基础,它的破灭也阻挡了人工智能本身的发展。墙倒众人推,研发节奏的缓慢导致质疑声卷土重来,应用狭窄、知识系统建立困难、维护成本高昂等诟病压得研究人员喘不过气来。十年前日本提出的第五代计算机计划也宣布失败。AI遭遇了一系列财政问题,进入第二次低谷。

至此人工智能经历两起两落,从初见雏形至此已经经过了快60年,“二十年内,机器将能完成人能做到的一切工作”的豪言壮语并没有变成现实。然而中国有句古话叫“甲子一轮回”,跌跌撞撞的60年走来,人工智能在不断的起伏中艰难前行。柳暗花明,人工智能的下一个60年开始变得豁然开朗。

1.1.3 新时代的人工智能

1965年,英特尔创始人之一戈登·摩尔(Gordon Moore)提出著名的摩尔定律—“当价格不变时,集成电路上可容纳的元器件的数目约每隔18~24个月便会增加一倍,性能也将提升一倍”。这一定律揭示了信息技术进步的速度。关于人工智能第一次低谷的原因,其中之一便是当时落后的计算机运算能力,但在1990年后,算力已不再是阻挡人工智能腾飞的障碍。20世纪90年代开始,计算机处理器的性能更新程度越来越快,伴随而至的人工智能也开始出现令人惊叹的成就,掀起新一轮高潮,直到今时今日。其中有四次著名的人机大战,从每一次比拼的变化中可以看到人工智能发展之迅猛让人瞠目结舌。

第一场:1997年,美国IBM公司的“深蓝”超级计算机挑战博弈树复杂度为10的123次方的国际象棋,以2胜1负3平战胜了当时世界排名第一的国际象棋大师卡斯帕罗夫,引起世界范围内的轰动(见图1-8)。相较于卡斯帕罗夫可以预判10步,“深蓝”依靠每秒可运算2亿步的强大的计算能力,穷举所有路数来选择最佳策略,高下立判。

图1-8 “深蓝”大战卡斯帕罗夫

第二场:2006年,浪潮天梭挑战博弈树复杂度为10的123次方的中国象棋,在比赛中,同时迎战柳大华、张强、汪洋、徐天红、朴风波5位大师。比赛按照2局制的规则进行,反复博弈后,浪潮天梭最终凭借每步66万亿次的棋位分析与检索能力,发挥出平均每步棋27秒的速度,以11∶9的总比分取得胜利。从那场比赛开始,象棋软件蓬勃发展,人类棋手逐渐难以与之抗衡。

第三场:2011年,“深蓝”的同门师弟“沃森”在美国老牌智力问答节目《危险边缘》中挑战两位人类冠军http://www.xinhuanet.com/science/2016-07/09/c_135171112.htm。比赛过程中,“沃森”展现出惊人的自然语言理解能力,不但能够准确识别题目内容,还能够分析线索的微妙含义,并理解讽刺反语等深层次的表达方式,再加上它3秒内检索数百万条信息的运算速度,最终轻松战胜两位人类冠军。

第四场:2016年,谷歌Deep Mind公司的深度学习AlphaGo挑战世界冠军韩国职业棋手李世石九段。这场比赛举世瞩目,博弈树复杂度为10的360次方的围棋一直被认为是人类最后的智力竞技高地。据估算,围棋的可能下法数量超越了可观测宇宙范围内的原子总数,显然1997年的“深蓝”式硬算在围棋上行不通。正因如此,人们长久以来一直认为只有人类擅长下围棋。但AlphaGo最终以4∶1战胜李世石(见图1-9)。更可怕的是,2016年到2017这个跨年夜,AlphaGo进阶版Master在某围棋网络对战平台上挑战中韩世界冠军,留下超过60盘连胜零负的成绩后绝尘而去,包括对当今世界围旗第一人柯洁连胜三局。

图1-9 AlphaGo对战李世石

四场比赛,20年的时间,体现人类智慧的竞技游戏,已被人工智能彻底占领高地,甚至有人戏称李世石将是最后一个可以战胜AI的棋手。与此相伴的是,人工智能在多个领域的全面繁荣成长。