第1章 机器学习基础
在本书的开始,先简单介绍一下机器学习(Machine Learning,ML)和深度学习(Deep Learning,DL)的基本概念. 机器学习,顾名思义,机器具有学习的能力. 具体来讲,机器学习就是让机器具备找一个函数的能力.机器具备找一个函数的能力以后,就可以做很多事. 比如语音识别,机器听一段声音,产生这段声音对应的文字.我们需要的是一个函数,它的输入是一段声音信号,输出是这段声音信号的内容.这个函数显然非常复杂,难以写出来,因此我们想通过机器的力量把这个函数自动找出来. 此外,还有好多的任务需要找一个很复杂的函数,以图像识别为例,图像识别函数的输入是一张图片,输出是这张图片里面的内容. AlphaGo 也可以看作一个函数,机器下围棋需要的就是一个函数,该函数的输入是棋盘上黑子和白子的位置,输出是机器下一步应该落子的位置.
随着要找的函数不同,机器学习有了不同的类别.假设要找的函数的输出是一个数值或标量(scalar),这种机器学习任务称为回归(regression).举个回归的例子,假设机器要预测未来某个时间段的 PM2.5 数值.机器要找一个函数 ,其输入可能是各种跟预测PM2.5数值有关的指数,包括今天的PM2.5数值、平均温度、平均臭氧浓度等,输出是明天中午的PM2.5数值.
除了回归,还有一种常见的机器学习任务是分类(classification).分类任务是要让机器做选择题. 先准备一些选项,这些选项称为类别(class),机器要找的函数会从设定好的选项里面选择一个当作输出.举个例子,我们可以在邮箱账户里设置垃圾邮件检测规则,这套规则就可以看作输出邮件是否为垃圾邮件的函数.分类问题不一定只有两个选项,也可能有多个选项 .
AlphaGo 解决的是分类问题,如果让机器下围棋,则选项与棋盘的位置有关.棋盘上有19×19个位置,机器其实是做一道有19×19个选项的选择题.机器要找一个函数,该函数的输入是棋盘上黑子和白子的位置,输出就是从19×19个选项里面选出一个最适合的选项,也就是从19×19个可以落子的位置里面,选出下一步应该落子的位置.
在机器学习领域,除了回归和分类,还有结构化学习(structured learning).机器不仅要做选择题或输出一个数字,还要产生一个有结构的结果,比如一张图、一篇文章等.这种让机器产生有结构的结果的学习过程称为结构化学习.