第4章 棋士为什么会输给人工智能
我以为不可能输
山中:人工智能的阿尔法围棋(AlphaGo)以四胜一负的压倒性胜利击败世界顶尖的围棋选手李世石,引发了广泛讨论。
羽生:是的,那是二〇一六年三月的事。那一年的二月,在日本放送协会NHK的栏目播出的NHK纪录片《天使或魔鬼 羽生善治 探索人工智能》探讨人工智能的时候,我和在谷歌旗下的英国深度思考公司开发了阿尔法围棋的杰米斯·哈萨比斯进行了会谈。大家都说围棋至少十年内赶不上人类,所以本以为是非常大的挑战。恐怕李世石自己也认为“不可能输”吧。
山中:人工智能的强大远远超出预期了。
羽生:是啊。将棋软件也在以超乎想象的速度变强。二〇一七年四五月的电王战上,将棋软件“PONANZA”对佐藤天彦名人两战两胜。
最近在对局转播中,将棋软件全部在同时解析。比方说,把当下的局面评价为正三百分,或者负二百分等。
山中:哎哟,还能这样啊。
羽生:我和软件下出同一手,还被它一步步修改说“这是正解”,真是可怕的世界。
山中:比较围棋的下法和将棋的下法,我本来以为将棋更复杂,其实围棋要复杂得多啊。
羽生:是的。从可能性的数量上说,围棋是十的三百六十次方,将棋是十的二百二十次方。而从软件的发展上说,将棋与国际象棋和围棋的历史稍微有些不同。
山中:说到国际象棋,我在一九九〇年代中期访问美国的时候,IBM的“深蓝”计算机首次战胜了世界冠军。
羽生:一九九七年深蓝击败了当时的世界冠军,俄罗斯的加尔里·卡斯帕罗夫。深蓝的强大是由于过去的庞大数据力,以及硬件计算处理能力的组合。
当时深蓝的数据库中已经储存了超过百万局的巨量棋谱,再加上每秒钟能够思考两亿种可能的硬件。二十多年前,软件还没有那么先进,但依靠数据和硬件的力量战胜了人类。
山中:就像推土机一样靠蛮力取胜。换了围棋,就算以今天的计算机技术,组合数量也无法计算吧。阿尔法围棋是从过去的对局识别大致的胜负模式,然后进行对局的吗?
羽生:阿尔法围棋采用的技术叫作“深度学习”,让机器通过学习来不断变强。学习有两个阶段,首先用人类之间的十五万份对局棋谱做基础。利用围棋网站的数据让它学习,能和职业棋手下出一样的棋。能和职业棋手下出一样的棋,意味着水平和职业棋手一样了。
然后再通过机器之间的对战变强。机器之间可以二十四小时满负荷对战,以一秒一局或者十秒一局的速度积累几十万、几百万场对局数据。以人类完全望尘莫及的速度变强。
阿尔法围棋的可怕之处在于,除了有这样的硬件和数据的力量,还有“启发式”,也就是不一定是正确的答案,但可以通过估算来确定大体符合要求的答案。
不是找到完全正确的答案,而是通过尝试获得相当接近的答案。相当于人类的第六感,或者将棋中的大局观那样的方式。我认为,阿尔法围棋的强大,在于将类似人类的思维方式引入程序、获取进步。
将棋软件的“加拉帕戈斯式”进化
山中:将棋软件与国际象棋和围棋软件的进化方式是不一样的吗?
羽生:是啊。国际象棋和围棋的软件,重视硬件能力和数据量,由谷歌等大企业开发并加强。然而,将棋界却没有巨额资本投入软件的开发。
将棋软件中,二〇〇五年保木邦仁开发的“Bonanza”是当时的最强软件,而且开放了源代码。独立程序员以它为基础,进行改良和修正,不断升级。
山中:具体来说,改良和修正都是哪些工作呢?
羽生:精简和强化程序中最难的是准确评价局面。在评价一个局面的时候,有所谓的“评价函数”,也就是将先手与后手哪个有利进行数值化。程序员在这里不断切磋琢磨,进行细致的修改,让软件不断变强。
山中:这几年来,将棋软件迅速变强,是有什么原因吗?
羽生:是因为有GitHub这个网站。GitHub是软件开发的开源社区。将棋软件基本上都上传到GitHub开源了,任何人都能自由使用它进行分析和研究。
谁都可以审查源代码,提出各种意见,“这里有点奇怪”“这里需要修改”等,而且也会不断上传最新版本。于是开发者看到以后也会想,“自己也开发一个将棋程序吧”。不管是专业还是业余的棋手都会用它来分析看看。结果水平就有了飞跃性的提高。
山中:这是和国际象棋还有围棋软件不同的地方。
羽生:之所以能做到这一点,其实也是因为销售将棋软件的市场早在大约十年前就消失了。软件太强大了,没人买了。没有了市场,也就没有了利害关系。既然如此,不如干脆开放源代码,让大家都能自由改进它。
一年一度的将棋软件大会结束后,名列前茅的若干软件会在网上公开,第二年又会出现以它们为基础的新软件。当年登顶的软件,下一年就会落到山腰。这样的情况不断出现,真的是以惊人的速度在进化。
山中:大家不是在决出将棋的胜负,而是在决出将棋软件的胜负了。(笑)
羽生:是啊。其实我本来认为,论软件而言,将棋落后国际象棋十年、十五年。国际象棋是世界上竞技人数最多的,论文的数量和质量也是相当高的。但是要说现在的情况,将棋世界里的强大软件都是免费的。而且还开发出共通的平台,能够对比使用若干软件。甚至还有人给不会用的人编写手册。非常体贴。
而另一方面,在国际象棋的世界里,要把软件全部整合到一起,非常花钱。所以国际象棋的软件没有那么多人用。因此,这五年来,我感觉将棋软件一口气超越了国际象棋软件,用起来最为方便。
山中:开发这种软件的人,大约不是为了收益吧。
羽生:没有收益。首先,那不是工作。不过我想,也可能是因为这样的情况:归根结底,如今的程序,大数据的数据力量,或者说硬件的计算资源,左右着整体的性能和功能。那么在程序员看来,不就没地方展现自己的能力了吗?(笑)程序员的比重下降了很多。在这个意义上,将棋软件能让人感觉到自己的价值。
山中:这样说来,将棋软件已经是个人兴趣的世界了。
羽生:是啊。而且我看,不同领域的人分享各种各样的想法、不断进步,开发者们也会觉得很开心吧。至今为止,创造出划时代程序的人,原本也是化学专业或者法学专业等完全不同世界的人。将那里获得的知识和经验置换过来,开发软件。我认为,这些人才的广泛进入,对软件的发展非常有益。
所以,将棋软件也有这样的一面,它不是依靠数据或硬件的力量,而是通过不断提升软件的力量变强大的。在这个意义上,我想可以说是实现了“加拉帕戈斯式的进化”[4]。
仅以电脑做练习对手的世代
山中:但是,不管怎么说,首先还是要看基础数据库的规模。
羽生:是的。医学世界固然具有巨量的历史数据,而在将棋世界,数据库里最多也就是十万局棋谱。十万局这个数量,作为数据来说,价值并不是很高。
山中:十万局还不够?
羽生:是的。打个比方,国际象棋的数据库,目前有八百万局以上的记录。基于如此庞大的数据,按照概率来选择下法,电脑至少不会在序盘落下风。
山中:是吗?不能把国际象棋和围棋软件应用到将棋上吗?
羽生:有的适合AI,有的不适合。比如围棋软件有“蒙特卡罗法”,就是先计算到棋局的最后,通过统计来判断是不是好棋的方法。但在将棋的情况中,有时候一百步就结束了,有时候两百步才结束,这种不适合计算到最后。
而在另一方面,将棋软件的预读、探索部分,主要用的是国际象棋的开源程序“Stockfish”。以前人们说“将棋软件没有通用性”,认为不可能把其他种类的软件应用过来,或者反过来应用到其他种类中去。但是这个Stockfish超越了种类的障碍,横向发挥出软件的功能。
山中:将棋界也受到了AI的影响。如果把AI应用在将棋的研究中,专业人士是不是也会有自尊心,认为“身为专业棋手,怎么能依靠机器”?
羽生:我想是有的。
山中:即使知道AI很优秀,但还是会有棋手拒绝它吧。
羽生:遇到那样的东西,因为自尊心的敏感而不采用它,也是一种态度。不过AI确实是很有用的工具,就像是计算的时候可以选择要不要用计算器一样。所以在必须自己思考的时候自己思考,而把很基础的、没有必要思考的地方交给AI,也未尝不可。
这一两年来,将棋软件已经非常强大了,特别是年轻人利用将棋软件进行分析已是普遍趋势。所以我想,今后的孩子们会把那样的东西作为工具,变得更强吧。
山中:和科学的世界一样,将棋世界的变化也很剧烈,也必须跟上那样的变化啊。
羽生:只是伴随技术的发展,这种事情也是一次又一次上演。最早是在出现棋谱数据库的时候。怎么更好地使用数据库,成为摆在棋手们面前的课题。然后是互联网的出现,大家都开始用互联网练习了。以前如果住得比较偏僻,就很难找到对局的对手,而有了网络,不管在哪里都能下棋。城市和农村的地理障碍从此消失,很多人年纪轻轻就有了丰富的对局经验。而现在则是有了软件或者说程序,如何有效使用这种程序,成为接下来特别是年轻一代所必备的能力之一。今后将会出现仅以软件做对手进行练习的强大的一代人吧。
为什么研究者倾向于隐瞒
山中:将棋软件是以开源为基础,齐心协力,最大限度发挥网络社会的优势,促使其不断进化。但是,我所在的生命科学的世界,研究竞争非常激烈,感觉大家都倾向于隐瞒自己的研究,直到发表论文的时候才公之于众。
羽生:前沿科学的世界,有点令人意外啊。
山中:没错。发表论文的过程,首先是将自己的论文发送到《自然》或者《科学》杂志的编辑部,然后由几个在做同样研究的研究者,基本上在匿名的情况下进行审阅,这叫作“同行评审”。再根据他们的意见,比如“这里最好做些调整”,进行修改。
羽生:经过各种过程才能刊登。
山中:最糟糕的情况是被拒,“这项研究毫无价值”。这种情况相当多。最好的结果是,“这项研究很精彩,我们立刻刊登”,然后一个月之后就登了。这种事情偶尔也会有,但是很少。大部分情况是给出意见退回,“这里有问题,请追加实验”“这里和这里请修改”,于是花费几个月时间追加实验,再发回去。然后又被退回来说,“这次请改善这个地方”。有时候需要一两年。所以生命科学的领域中,现在在做的研究,最早也要等两三年才能问世。
羽生:时间相当滞后啊。
山中:相当滞后。科学技术日新月异,数据很快就能拿到。而且是巨量数据。但是无处发表,只能一直抱在手上,这已经成为现在的大问题了。
越来越多的人认为,生命科学也应该改变发表的方法了,现在需要实时问世的机制,但一直没能取得什么进展。毕竟,过去一百多年来,我们的研究目标都是这样发表论文。
羽生:这种研究习惯也是很顽固的。
山中:是的。很难改变这种习惯。发表论文就是我们的生命。如果由研究领域接近的几位研究者进行评分,那么得分必然会被自己和他们的关系好坏所左右。这就很难说公平。
一切都“实时”的时代
羽生:我最近听说了一个很有趣的消息,说的是康奈尔大学的数字化收藏项目“arXiv”。那是将物理、数学、计算机等领域的研究论文预印本进行电子数据化存档和公开的电子档案服务。
如果从研究到发表需要一定时间,人们就很难知道其他研究者正在研究什么。但是去看arXiv就会知道目前人们在做哪些最新的研究,因为上面刊载了审查前的论文。也有许多研究者在那上面做验证。
山中:在很久以前,物理学和数学领域就有那样的实时发表渠道。发表论文是最后补足的完成形态。在学会或网络上的发表,也会不断给出数据,同时接受实时的批评。如果有错误,自然会有人发现。许多学术领域都是这样的情况。
但是生命科学的传统是隐瞒,直到论文发表为止。在学术研讨会上发表的时候,也要把重要的地方隐藏起来。一直都是这样的风格。比如基因分析,如果发现某个序列与某种疾病有关,当然会写成论文。但与之同等重要的信息是,这个序列与疾病有关,但那个序列与疾病无关。
羽生:是的。
山中:但是按照目前生命科学的发表方式,这样的信息基本上不会公布,结果造成研究资源的浪费。
羽生:很可能会出现这样的情况:重复做了同样的研究,或者其他研究室已经得出结论了——
山中:这种情况我觉得很多。数据越多越准确,错误也会越少。但是与其他共享大数据的领域相比起来,生命科学领域没有进步,研究发展面临巨大的障碍。
创立Facebook的马克·扎克伯格,他的妻子是儿科医生,所以他给科学研究捐了很多钱。二〇一六年,一个家庭就投入了三十亿美元,启动了一项消除疾病的研究项目。他们试图将生命科学的发表方式改变成刚才提到的arXiv那样的开放形态。这项计划也得到了许多捐赠。
羽生:科学论文网站的订阅费很高,所以很多机构都不得不停止订阅,这也是问题啊。大学生不满这样的情况,通过电脑技术,免费公开几十万份科学论文,结果又会受到论文期刊方的投诉。
山中:论文和期刊原本应该是为了推动研究的发展,现在有些地方却反而变成了阻碍。
羽生:其他领域也可能有这种情况,但因为这是伴随研究产生的权利,或者与专利有关,所以也不可能一切都保持自由和开放。
山中:确实如此。研究中也会产生专利,该保护的地方确实也应该保护。
提倡专利降价的原因
羽生:关于专利,我也想请教一下。美国有“专利流氓”的问题,就是有人从他人手中购买收集专利,等到有人侵犯了那些专利,就去索取巨额赔偿金或者许可费。生命科学的世界里也有这种情况吗?
山中:有的,有的。有些公司很喜欢这么干。所以我们申请专利,有时候并不是为了获得利益,而是为了防护。
羽生:原来如此。
山中:iPS细胞是很基础的技术。以它为平台,可以开发出各种应用。所以我们虽然开发出iPS细胞,但希望能有更多的人使用这项技术,尽可能不做任何限制。
但正如您说的那样,除了我们的专利之外,也有公司基于营利目的申请专利。如果那些专利申请成功,哪怕只是部分内容,iPS细胞技术也会很难使用。
专利本来是为了保护企业能够独占技术开发的利益而建立的制度,但在我们看来,作用却完全搞反了。京都大学这样的公立机构取得专利,设置合理的许可费,通过这样的做法,避免某个企业通过专利独占技术,确保各个研究机构能够更加广泛和自由地使用iPS。所以虽然都是申请专利,意义完全不同。实际上,我们在二〇一七年,曾经要求富士胶片降低细胞开发和制造的专利许可费。
羽生:与其让企业持有专利,还是大学持有专利更具公益性啊。
山中:大学持有专利非常重要。因为企业是以收益为目的的。企业新开发的药物和医疗手段,成本非常高,甚至有患者会为此花费掉一亿日元。这是全球性威胁。
羽生:企业股东追求利润,这也是理所当然的。
山中:是啊。无论如何,各项应用如果不能提高收益,就肯定无法发展。但是归根结底,我们还是希望基础的技术能得到更广泛的使用,就像操作系统一样。以前微软不断公开操作系统,苹果就很封闭。虽然很难说哪种做法更好,但是目前基本上,基础部分的公开已经成为世界性的潮流。生命科学的领域也是,根本性的技术尽可能不要封闭,我认为这对于推动研究来说非常重要。
人会揣测,因而会犯错
羽生:不过,不同国家的专利申请方式并不相同,非常复杂。
山中:是的。当年只有美国采用“发明优先原则”的方法。其他国家,包括日本和欧洲,都是“申请优先原则”。
羽生:意思是先申请者优先?
山中:这是重视申请者权利的原则。提出申请的日期有具体的公开记录,清清楚楚。但在美国,即使申请以后,一旦有人提出不同的主张,说“不,实际上是我更早想到的”,也有可能被承认。要应对这样的主张,唯一的方法就是留下详细笔记,记录创意和想法是何时诞生的。而且不能只有自己写,因为可能是事后补的,所以需要第三者定期签名。这样的笔记验证我也做过,用来应对美国的发明优先原则。
羽生:那要花费很多工夫吧。
山中:是的。不过在奥巴马总统任职期间,美国也改成了申请优先原则,和其他国家保持一致了。从这个意义上说,如今倒是不再需要笔记验证。不过我们为了防止非法研究,还是在继续验证笔记。
羽生:记录也很重要。
山中:是的。规则虽然都一样了,但是做审查的还是人。美国的专利局、日本的专利局,都是由审查团来做审查。特别是美国,针对某项专利申请,通常是一个人审查决定。
羽生:这样的吗?
山中:所以那个审查人的想法会对结果产生很大的影响。如果能保持公平裁决当然很好,但在我们看来,有的裁决还是不太合理的。不知道是不是他们的国策,总之有些地方过于考虑自己国家的利益。
羽生:论文审查也是同样的问题。不像网球,如果对判决不服,可以“鹰眼挑战”[5]。(笑)
山中:如今球赛的规则非常清晰。以前的美学观念是,就算裁判做了完全错误的判罚,也必须遵守。现在几乎所有的球类比赛都有录像记录,挑战发现判罚错误的时候,判罚会被推翻。在这一点上,拳击、花样滑冰、体操等需要评分的竞技项目,很难做到客观判断。由人类来做的工作,怎么都——
羽生:法院审判也是这样。需要得出现实结论的时候,常常会担心人类做的判断难免带有偏见,或者代表某种利害关系。这本身虽然说不上是揣测,但毕竟存在这样的可能。
山中:所以,专利的裁定、论文审查、评分竞技,最好不要由人来做,而是让公平公正的AI来做。(笑)