自然语言处理实战:从入门到项目实践
上QQ阅读APP看书,第一时间看更新

前言

自然语言处理(NLP)是计算机科学、人工智能和语言学的交叉学科。它关注的是如何构建能够处理和理解人类语言的系统。自20世纪50 年代创立以来直到最近,自然语言处理主要是学术界和实验室的阵地,掌握它需要长期的正规教育和训练。但过去十年的突破使得自然语言处理越来越多地应用于零售、医疗、金融、法律、市场营销和人力资源等一系列领域。这些进展背后的推动力列举如下。

  • 广泛可用和易于使用的自然语言处理工具、技术和API 已经在这一行业遍地开花。现在正是快速构建自然语言处理解决方案的好时代。
  • 更具可解释性和通用性的方法改善了开放式对话、问题回答等复杂自然语言处理任务的基准性能,这在以前是不切实际的。
  • 谷歌、微软和亚马逊等越来越多的公司在大力投资以语言为主要交流媒介的交互性更强的消费产品。
  • 不断增加的开源数据集及其标准基准,在这场变革中起到了催化剂的作用(相反,仅限于个别组织和个人使用的专有数据集则会起到阻碍作用)。
  • 自然语言处理的可用性已经延伸到英语以外的其他语言。对于数字化程度较低的语言,数据集和基于特定语言的模型也正在创建中。这项工作的一个成果是自动机器翻译,它接近完美,凡是有智能手机的人都可以使用。

随着使用范围的迅速扩大,搭建自然语言处理系统的人也越来越多。他们亟须克服经验不足和理论知识欠缺的问题。这本书从应用的角度解决了这种需求。本书的目的是指导读者在业务场景中构建、迭代和扩展自然语言处理系统,并根据各个垂直行业进行相应的调整。