突破数理基础,才能让人工智能学会学习
信风智库:从数理基础的角度看,机器学习乃至人工智能进一步发展,还需要解决哪些问题?
徐宗本:这是个很深刻的问题。很显然,人工智能已经突破了从“不可以用”到“可以用”的技术拐点,正在从“可以用”迈向“很好用”,处在从人工化走向自动化的“前夜”,迈向自主化的初级阶段。而它的发展也不仅仅是用到了线性代数、统计学和概率论等背景学科知识,人工智能的核心能力应该是算法、算力和算据,即以深度学习为代表的模型、以超级计算为代表的计算资源以及以大数据为代表的数据资源。基于这三种基本能力,人工智能才变成了可以应用的技术。
中国在人工智能应用方面走在世界前列,因为我们有大量的数据资源,这是天然的优势。我们将人工智能应用到各个领域,探索了很多模式,也实现了较好的变现。但是,从应用研究上来看,目前的发展阶段与人工智能的真正目标相比,还相差甚远。人工智能的最终目标是利用人工智能的基本逻辑,搭建一个系统智能体,像人一样去适应环境,实现自由决策、自动反应和自主行动,代替人去做一些繁杂的劳动,切实解决现实社会中劳动成本高的问题;代替人从事一些高风险的工作与探索,让人们远离危险,真正意义上解放劳动力,提升生产力,而不仅仅是刷脸、线上支付等初级应用。实现这一目标,还存在诸多技术瓶颈,亟须重大技术变革,我们还有很长的路要走。
虽然目前的人工智能也运用到了数据分析,但还不具备像人一样的思考能力。它还需要解决以下几个问题。
首先,是形成新的统计学理论。传统的统计学是基于两个概念,一个是“独立同分布”的基本假设,简单来说就是事物之间是独立的,但它们都具有一定的系统结构分布。基于这样的假设,抽样调查便成了可能。因为抽样里的部分样本,都会服从总体样本的分布。
另一个就是概率论。比如一对夫妇生男孩或生女孩,概率是一样的;又比如掷硬币,正面和反面的概率也是一样的。但是,它们必须有一个前提,就是操作的次数要无穷大,才符合概率论的理论支撑。这也叫作无穷远形态或者大样本性质。
传统统计学更注重数据呈现的结果。但实际上,如果数据量有限,其结果也不足以形成好的决策方案。而大数据与人工智能的发展则改变了这一思维方式,它更看重问题的本质。大数据的核心是从传统统计学理论中找到细微的指标,然后通过人工智能大量采集核心数据并对指标进行运算,从而得出更具指导性的结论。所以,以大数据为核心的新统计学理论不是对传统统计学的颠覆,而是在它的基础之上进行补充和升级。
其次,是建立以大数据计算为基础的新算法。举个很通俗的例子,我们把数据分析应用比喻成做菜,以前数据样本少,油盐等调料和食材都放在锅的旁边,需要什么、需要多少直接拿,不管好不好吃,至少一盘菜很快就做好了。但现在是大数据时代,食材和调料多而杂,只能用仓库来储存,而且还有很多都放错了位置。在这种情况下做菜,便需要用到新的方式,也就是新的算法。
这些算法的本质就是线性方程组求解、图计算、最优化计算以及高维积分等数学问题。比如地图智能导航从西安到北京怎么走,过去地图分辨率不高,根据普通的地图可以获取基本的路线。但随着信息技术的发展,地图的分辨率越来越高,不可能一次就涵盖西安至北京之间全部城市与道路的数据,只能一次次地分别给出其中某些城市之间的道路信息。那么怎样走最近、要带多少钱,其实就是在解决分布式图信息环境下的图计算基础算法问题。
最后,是深度学习的问题。人工智能的核心是深度学习,但是如何解释深度学习后的结果是未来需要解决的问题。比如智慧医疗的应用,人工智能通过对积攒的病例大数据进行深度学习,找出规律,从而实现机器自动诊断。但是,一个病人来检查,机器告诉他得了白血病,他不接受,你如何解释呢?机器深度学习的过程极其复杂,并且通过黑箱运算,没有办法解释。
又比如智慧金融,一个客户来贷款,风控系统对其经济状况、社会关系等数据模型进行运算,得出了不符合贷款要求的结果,客户也不能接受,需要一个解释,你也无法给出解释。
深度算法是人工智能最基本的特征。虽然并不是每一个应用都能解释,但是如果我们想要将人工智能技术应用到更多的领域和场景中去,有些决策也不得不解释。换句话说,人工智能想要得到更高的发展,还需要解决很多基础的数理问题。
徐宗本院士总结的人工智能十大数理基础问题
信风智库:元学习是学习如何学习,是弱人工智能迈向强人工智能的重要突破口之一。那么,让人工智能掌握学习方法论意味着什么?我们目前已经进行了怎样的探索,还要解决哪些问题?
徐宗本:这是一个很好的问题。现在的人工智能实际上还处于完成任务的学生阶段。怎么理解?我们要做一件事情,就要为人工智能搭建一个系统,这个系统只限于完成这一个任务。如果要执行其他任务,就还需要搭建另一个独立的系统。简单来理解,就是目前的人工智能只会做事,却没有方法论,所以我们称它为弱人工智能。
但很显然,我们对人工智能的长期目标是希望它能够真正地模拟人去适应环境、理解语言,甚至学会独立思考,这个目标就是我们追求的强人工智能,也是老师阶段。强人工智能的特点就是具备了学习方法论的能力,也就是元学习。
那么什么是超人工智能呢?其实这是另外一个维度的概念。首先我们要理解,“超”其实是一种能力的扩展,并不是一种人格智能。技术的本质是延伸人体器官功能的方式方法。人类为了更好地生存,就通过技术创造了比人体本身更强的能力。
比如人跑不快,就发明了汽车;人运算能力有限,就发明了计算机;人为了能够上天,发明了飞机,这些都是人体自身做不到的事情,但是技术为人类实现了。所以从这个维度来理解,超人工智能并不是比人更有智慧,甚至取代了人类,它只是在某些特定能力上比人类更突出,是对人工智能的一种形容。
实际上,弱人工智能、强人工智能和超人工智能是交错发展的。现在很多机器智能已经超过了人类的智能,比如计算效率,计算机不但速度快,且不知疲惫,也不会受情绪影响。为什么阿尔法狗能够打败围棋高手,有一部分原因就是它不知疲倦,也不会被输赢所影响,这是它的优势。
这里我再举个例子,自动驾驶其实就是汽车在行程当中自动完成一个又一个的任务。如果我们把一辆汽车放在一个封闭的空间内,给它设计好特定的程序,它实现全路程自动驾驶当然没有问题。但是,如果放在自然的交通线路上,它就无法完成了。因为设定好的程序只有一个固定任务,那就是按照线路跑完全程。但在实际道路中,会发生很多随机的情况,比如起大风了、风沙来了、有其他车辆变道超车或者有行人突然越过障碍等,这时候任务就变了。
这背后其实就是元学习的问题。我们给汽车装上了摄像头、雷达等各种各样的传感器,其本质是收集各种各样的环境信息,然后对信息进行处理,最终自动做出决策。
以前,信息任务的自动化处理是分离的,比如去噪、跟踪与光平衡等任务,机器无法根据环境变化自动切换任务。而元学习就是让机器具备学习各种任务处理的学习能力,也就是让机器掌握一种应对各种问题的学习方法论。这样一来,机器就能根据环境信息,自动切换各种信息处理任务,自动形成新的解决方案,比如自动驾驶汽车探测到周围的环境变化,及时做出反应,如减速、变向或停车等,甚至选择最优的路线继续行驶。