深入浅出Python量化交易实战
上QQ阅读APP看书,第一时间看更新

3.1.1 有监督学习和无监督学习

在机器学习领域,有监督学习(supervised learning)和无监督学习(unsupervised learning)是常见的两种方法。为了帮助小瓦理解这两种方法的不同,我们可以用一个小例子来阐述。

例如,我们给小瓦一堆化妆品,如图3.1所示。

图3.1 一堆化妆品

相信小瓦与其他女生一样,可以很轻松地叫出图3.1中每样化妆品的名字。这是因为在小瓦的认知当中,每种物品已经有了一个标签(label),如口红、眉笔、粉扑。这些标签对应着不同的特征(feature),例如,“红色”“用来涂在嘴唇上”的,对应的就是“口红”这个标签。图3.1中符合这个特征的化妆品,就会被小瓦归入“口红”这个类别。对于模型来说,这种有已知标签的任务就是有监督学习的一种。

我们再给小瓦一些不同的物品,如图3.2所示。

图3.2 一个计算机主板

这时我们再来要求小瓦说出如图3.2所示计算机主板上零件的名字,就有些难为她了。毕竟小瓦没有接触过这个领域的知识,也就是说,在小瓦的脑子里,没有这些零件所对应的标签。即便如此,小瓦还是可以通过观察这些东西的特征,将它们归到不同的类别中,例如,有些是“黑色凹槽”,有些是“白色凹槽”,有些是“黑色圆柱”——虽然不知道它们具体是什么东西,但还是能够看出它们的作用肯定是不同的。这种没有已知标签,但是让模型通过观察特征将它们放入不同类别的过程,就是无监督学习的一种。