1.2 神经网络的监督学习应用
神经网络也有很多的种类,本质上都离不开监督学习。在监督学习中,有一些输入x,想学习到一个函数来映射到一些输出y,比如之前提到的房价预测的例子,只要输入有关房屋的一些特征,即可试着去输出或者估计价格y。图1-4列举一些其他的例子来说明神经网络已经被高效应用到其他地方。
由于结合了深度学习,计算机视觉在过去的几年里也取得了巨大的进步。例如,可以输入一个图像,然后想输出一个索引,范围从1~1000,它可能是1000个不同的图像中的任何一个,可以选择用它来给照片打标签。
深度学习最近在语音识别方面的进步也很大,现在可以将音频片段输入神经网络,然后让它输出文本记录。机器翻译可以利用神经网络输入英语句子,接着输出一个中文句子。
图1-4 神经网络的监督学习应用领域
在自动驾驶技术中,可以输入一幅图像,以向一个信息雷达展示汽车前方有什么。可以训练一个神经网络,来告诉汽车在马路上面具体的位置,这就是神经网络在自动驾驶系统中的一个关键部分。
图像应用经常在神经网络上使用卷积神经网络(Convolutional Neural Network,CNN)。对于序列数据,例如音频等一维时间序列,经常使用递归神经网络(Recurrent Neural Network,RNN)。语言也是最自然的序列数据,因此更复杂的RNN版本经常用于这些方面。
为了更具体地说明什么是标准的CNN和RNN结构,图1-5的左图是一个标准的神经网络,而右图是一个卷积神经网络的例子。
图1-5 标准神经网络、卷积神经网络和循环神经网络
机器学习对于结构化数据和非结构化数据的应用很多,结构化数据意味着数据的基本数据库。例如在房价预测中可能有一个数据库,有专门的几列数据列出卧室的大小和数量,这就是结构化数据。或预测用户是否会点击广告,则可能会得到关于用户的信息,比如年龄以及关于广告的一些信息,然后对用户的预测分类标注,这就是结构化数据,意思是每个特征,比如房屋大小、卧室数量,或者是一个用户的年龄,都有一个定义。相反,音频、原始音频或者用户想要识别的图像或文本中的内容是非结构化数据。这里的特征可能是图像中的像素值或文本中的单个单词。深度学习和神经网络现在能更好地解释非结构化数据。