TensorFlow与自然语言处理应用
上QQ阅读APP看书,第一时间看更新

第2章 深度学习基础

2.1 深度学习介绍

具有机器学习基础的朋友可能都知道,机器学习实际上是一个寻找最优模型的过程。深度学习是机器学习的一个扩展领域,其概念源自于科学家对人工网络长期研究的积累,深度学习的基本结构其实也是深度神经网络。在深度学习下实现的算法集合与人类大脑中的刺激和神经元之间的关系具有相似之处。深度学习在计算机视觉、语言翻译、语音识别、图像识别等方面具有广泛的应用。这些算法集很简单,既可以在有监督的情况下学习,也可以在无监督的情况下学习。

大多数的深度学习算法都是基于人工神经网络的理念,数据丰富,计算资源充足,使得目前世界上对这种算法的训练变得更加容易、深度学习模型的性能得到不断提升。对于这一点,我们可以在图2-1中看到更好的表示。

图2-1 基于神经网络的深度学习算法和传统学习算法效果图

这里深度学习中的“深度”是指人工神经网络结构的深度,而“学习”是指通过人工神经网络本身进行学习。图2-2给出了深度和浅度网络之间差异的展示,以及为什么“深度学习”会受到大家的热捧。

图2-2 深度和浅度网络示意图

通过利用深度神经网络,我们能够从未标记和非结构化数据(如图像(像素数据)、文档(文本数据)或文件(音频、视频数据))中寻找出潜在的结构情况(或特征学习)。实际上,虽然深度学习中的人工神经网络和模型在本质上具有相似的结构,但这并不意味着两个人工神经网络的组合在利用数据进行训练时,我们获得的表现(或效果)与深度神经网络就相似。其中一个重要的原因是,深度神经网络与普通人工神经网络之间所使用的反向传播方式不同。

接下来,我们先介绍一下深度学习的演变过程,然后从神经网络开始详细解读。