1.4 机器学习和深度学习
1.4.1 什么是机器学习
要说明什么是深度学习,首先要知道机器学习、神经网络、深度学习之间的关系。
众所周知,机器学习是一种利用数据训练出模型,然后使用模型预测的技术。与传统的为解决特定任务、通过编码实现的软件程序不同,机器学习使用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。
机器学习是人工智能的子领域,机器学习理论主要是研究、分析和设计一些让计算机可以自动学习的算法。
举例来说,假设要构建一个识别猫的程序。按照以往的方式,如果我们想让计算机进行识别,需要输入一串指令,例如猫长着毛茸茸的毛、顶着一对三角形的耳朵等,然后计算机根据这些指令执行下去。但是,如果我们对程序展示一只老虎的照片,程序应该如何反应呢?更何况通过传统方式制定全部所需的规则,在此过程中必然会涉及一些困难的概念,比如对毛茸茸的定义。因此,更好的方式是让机器自学。我们可以为机器提供大量猫的照片,机器系统将以自己特有的方式查看这些照片。随着实验的反复进行,系统会不断学习更新,最终能够准确地判断出哪些是猫,哪些不是猫。
在这种机器自学的方式中,我们不给机器规则,取而代之的是,我们给机器提供大量的针对某一任务的数据,让机器自己去学习,去挖掘出规律,从而具备完成某一任务的智能。因此,机器学习就是通过算法,使用大量数据进行训练,训练完成后会产生模型,训练好的模型就用于新数据结果的预测。
机器学习的常用方法主要分为监督式学习(Supervised Learning)和无监督式学习(Unsupervised Learning)。
1.监督式学习
监督式学习需要使用有输入和预期输出标记的数据集。比如,如果指定的任务是使用一种图像分类算法对男孩和女孩的图像进行分类,那么男孩的图像需要带有“男孩”标签,女孩的图像需要带有“女孩”标签。这些数据被认为是一个“训练”数据集,通过已有的训练数据集(即已知数据及其对应的输出)去训练,从而得到一个最优模型,这个模型就具有了对未知数据进行分类的能力。它之所以被称为监督式学习,是因为算法在使用训练数据集进行学习的过程中就像是有一位老师正在监督。在我们预先知道正确的分类答案的情况下,算法对训练数据不断进行迭代预测,其预测结果由“老师”不断进行修正。当算法达到可接受的性能水平时,学习过程才会停止。
在人对事物的认识中,我们从孩童开始就被大人们教授这是鸟、那是猪、那是房子,等等。我们所见到的景物就是输入数据,而大人们对这些景物的判断结果(是房子还是鸟)就是相应的输出。当我们见识多了以后,脑子里就慢慢地得到了一些泛化的模型,这就是训练得到的那个(或者那些)函数,之后不需要大人在旁边指点,孩子也能分辨出来哪些是房子,哪些是鸟。
2.无监督式学习
无监督式学习(也被称为非监督式学习)是另一种机器学习方法,它与监督式学习的不同之处在于事先没有任何训练样本,而需要直接对数据进行建模。这听起来似乎有点不可思议,但是在我们自身认识世界的过程中,很多地方都用到了无监督式学习。比如,我们去参观一个画展,就算之前对艺术一无所知,但是在欣赏完多幅作品之后,我们也能把它们分成不同的派别(比如哪些更朦胧一点,哪些更写实一些,即使我们不知道什么叫作朦胧派,什么叫作写实派,但是至少我们能把它们分为两类)。