1.9 总结
在本章中,为了建立本书的基本框架,我们首先解释了为什么我们需要NLP,然后讨论了NLP的各类任务。对于NLP的来龙去脉,我们又从理性主义和经验主义到当前深层学习浪潮的三次自然语言处理浪潮出发,回顾了自然语言处理领域几十年来的历史发展情况,以便从历史发展中提炼出有助于指导未来方向的见解。接着,我们对于当前NLP中深度学习的局限性进行了解读。最后,我们对于NLP中的应用场景和前景做了简述。
首先,我们通过一个日常生活中常见的寻找小吃店位置的例子开启了解读NLP的篇章,并对NLP主要的工作任务进行了初步划分,包括标记化、词义消歧、词性标注、实体命名识别、句子或概要分类、文本生成、问答系统、机器翻译等。
其次,通过对于NLP发展的三个阶段的分析,我们知道当前的NLP深度学习技术是从前两波发展起来的一种NLP技术概念和范式上的革新。这场革新的关键支撑包括通过嵌入对语言实体(子单词、单词、短语、句子、段落、文档等)的分布式表示、嵌入引起的语义概括、语言的大跨度深层序列建模、能够从低到高有效表达语言水平的层次网络以及端到端的深度学习方法,以共同解决许多NLP任务中的问题。在深度学习浪潮出现之前,这些都是不可能实现的,这不仅是因为之前的两次发展浪潮缺乏大数据和强大的计算能力,更重要的是在于近年来深度学习范式出现了之前缺少的正确框架。
接着,我们对于当前NLP领域深度学习方面的局限性进行了解读,并给出了局限性存在的成因和简要的解决之道。
最后,我们对于NLP的常见应用领域进行了说明并给出了NLP的发展前景。
总之,深度学习开创了一个新的世界,使得NLP比过去任何时候都更具有活力。深度学习不仅提供了一个强大的建模框架,用于表示计算机系统中人类自然语言的认知能力,更重要的是,它已经在NLP的许多关键应用领域创造了卓越的实际效果。在本书的其余章节中,将提供使用深度学习框架开发(具体利用TensorFlow工具)的NLP技术的详细描述,同时也希望本书能够对NLP领域的人员有一些帮助,以便使得NLP领域有更多突破性成果的出现。接下来的一章,我们将介绍深度学习基础。