2.2.2 深度学习的应用
目前深度学习的落地点并不是特别多,主要应用于语音处理、图像处理和自然语言处理。
AlphaGo是2016年上线的智能机器人,当时它挑战了韩国的九段棋手李世石并以4∶1的战绩取胜,随后又连续击败了60余名中日韩的高段位棋手,到了2017年,又以3∶0一举击败了当时世界排名第一的柯洁。这种和人类下棋的程序其实很早就有,在20世纪90年代,IBM公司的国际象棋对弈系统“深蓝”就挑战了当时世界国际象棋排名第一的卡斯帕罗夫,并取得了胜利。然而当时媒体界及学术界部分人认为,人类虽然会败给国际象棋的计算机程序,但是如果让这个计算机程序去下围棋,它是不可能打败人类的。这是因为在国际象棋的竞赛当中,“深蓝”采取的是穷举算法,把国际象棋的64个格子中所有可能出现的排列全部枚举一遍,然后分别计算每一种排列的胜利概率,以此战胜人类。但是如果换成围棋,棋盘上有361个点,如果将黑白棋子的所有可能全部枚举出来,得到的情况会比整个宇宙中的原子数还要多,这根本无法实现,所以有些人认为计算机在围棋上根本不可能战胜人类。但是AlphaGo挑战了这一观点,因为AlphaGo并没有穷尽所有的可能,而是学习了100多万盘人类对弈的棋局,然后利用深度神经网络从中提取出人类对弈的种种模式,获取有效步骤,无视无效步骤,这就是AlphaGo的神奇之处。
AlphaGo虽然很厉害,但是普通人并没有机会接触到它。一个离普通人最近的深度学习应用是智能音箱。目前智能音箱种类非常多,例如小米音箱和百度音箱,以及苹果公司和微软公司也有各自的智能音箱。人们可以通过语音来控制智能音箱执行播放等功能,这涉及语音识别功能;除此以外,还可以跟智能音箱进行对话,这属于聊天机器人的功能,该功能是利用机器学习或者深度学习构造的;在机器人得出答案之后,还要再用人类的语音播放出来,这涉及语音合成功能。因此,语音领域是当前深度学习落地最充分、实战性最强的一个领域,语音识别和语音合成便是最好的代表。
深度学习还有一个应用领域是自动驾驶,特斯拉、谷歌、百度等很多企业都在这方面开展了研究。自动驾驶包含对一系列技术的复杂综合,研发公司首先需要具备汽车工程方面的技术,其次需要具备感知技术。现在一般有两种方法进行感知,一是利用图像识别,通过对采集到的图像进行分析来做出决策,另一种是通过激光雷达来感知。最后需要具备驾驶算法,如车辆通过什么算法做出决策?怎么判断加速、减速、左拐、右拐还是停车?这种算法很复杂,也是当前很热的深度学习研究方向之一。
自动驾驶技术目前还不是很成熟,特斯拉和Uber等公司在自动驾驶尝试过程中都发生过交通事故,而且这种交通事故的认定很复杂,到底是人的责任还是机器学习的责任,目前在学术界和法律界仍存在争议,所以自动驾驶技术离真正上路还有一定距离。