Rasa实战:构建开源对话机器人
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人


1.2.2 自然语言处理的基础任务

高效率的字、词或句子的向量表示方法,大大减轻了我们对人工特征工程的依赖。在此基础上,自然语言处理(NLP)有一系列的基础任务。

如果把一段文本理解为一个序列,把各种标签理解为不同类别,那么NLP基础任务根据问题本质的不同可以分为以下几种。

● 从类别生成序列:包括文本生成、图像描述生成等任务。

● 从序列生成类别:包括文本分类、情感分析、关系提取等任务。

● 从序列同步生成序列:包括分词、词性标注、语义角色标注、实体识别等任务。

● 从序列异步生成序列:包括机器翻译、自动摘要、拼音输入等任务。

由此可见,构建对话机器人可归为从序列生成类别的文本分类任务;实体标注可归为从序列同步生成序列的实体识别任务;语音识别可以理解为一个广义上的从序列(语音信号)同步生成序列(文本)的任务,语音合成则反之;对话管理在很大程度上是一个广义上的从序列(对话历史)生成类别(当前动作)的任务。