1.1.3 机器学习、人工智能、深度学习的关系
人工智能(Artificial Intelligence,AI)范围很广,它是一门新的科学与工程,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的技术科学,研究内容涵盖语音识别、图像识别、自然语言处理、智能搜索和专家系统等。人工智能可以对人的意识、思维的信息过程进行模拟,像人类那样思考、也有可能超过人的智能。人工智能起源于著名的图灵测试,从那时起,引发无数科学家为实现人工智能进行种种探索,从而不断地推动计算机技术进步,创造出一个又一个奇迹。
机器学习是人工智能的一个分支,是实现人工智能的方法之一。机器学习是对人类生活中学习过程的一个模拟,而在这整个学习过程中,最关键的是数据。计算机科学家和机器学习先驱Tom M.Mitchell给机器学习下了这样一个定义:“机器学习是对计算机算法的研究,允许计算机程序通过经验自动改进。”任何通过数据训练进行学习算法的相关研究都属于机器学习。kNN、K-Means、Decision Trees、SVM、朴素贝叶斯、感知机、EM算法、逻辑回归及ANN(Artificial Neural Networks,人工神经网络),都是常见的机器学习算法。
深度学习(Deep Learning,DL)是一种机器学习方法,发展于人工智能的联结主义学派,其概念源于人工神经网络,它通过组合低层特征形成更加抽象的高层特征,其动机在于建立、模拟人脑进行分析学习。与传统的机器学习方法一样,深度学习也是根据输入的数据进行分类或者回归。传统的机器学习方法在面对数据量激增的情况下,其性能表现得差强人意,与此形成鲜明对比的是,深度学习反而表现出卓越的性能,特别是在2010年之后,各种深度学习框架的发布及其在各领域的突出表现,更进一步促进了深度学习算法的发展。
今天,人工智能已经成为一门庞大的综合学科,各领域无不存在人工智能的身影,机器学习作为实现人工智能最重要的方法之一,通过对数据进行分析处理,帮助计算机做出各种判断和决策。深度学习是机器学习的一个细分领域——人工神经网络的一个分支,在图像处理、语音识别、自然语言处理等领域取得了非常好的效果。机器学习、人工智能、深度学习三者之间的关系如图1-6所示。
图1-6 人工智能、机器学习与深度学习之间的关系
数据挖掘(Data Mining)作为与机器学习经常相提并论的概念,二者的侧重点不同,数据挖掘旨在从海量数据中“挖掘”隐藏的信息(这些数据可能是“不完全的、有噪声的、模糊的”),并利用机器学习技术(不限于机器学习技术)对这些数据进行处理,以辅助决策。因此,数据挖掘是将机器学习作为工具,研究的是如何利用好这个工具,侧重于算法的应用。机器学习侧重于研究算法本身,如何分析并改进算法。