上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.1.3 传统语言模型的应用
传统语言模型输出的概率通常作为一个标识单词序列“合法性”的先验打分,在语音识别、拼写检查、机器翻译、光学字符识别、手写识别中都会发挥关键作用。如果用X表示应用中的输入,Y表示应用中的输出,这些问题可以建模为如下数学问题:
其中,P(X|Y)是与具体应用相关的模型,P(Y)为针对Y的语言模型。
例如,在语音识别中,X表示输入的音频信号,Y表示识别出来的文本。P(X|Y)一般被称为声学模型(Acoustic Model),主要用于衡量识别出来的文本的发音和音频的相似程度。P(Y)则为语言模型,用于衡量识别出来的文本是否符合语言的使用惯例,声学模型和语言模型一起发挥作用,产生质量较好的识别结果。在机器翻译中,X表示源语言书写的文本,Y表示目标语言书写的文本。P(X|Y)一般被称为翻译模型(Translation Model),主要用来衡量两种语言书写的文本是否具有相似的含义。语言模型P(Y)的作用与在语音识别中的作用相同,衡量目标语言的文本是否符合该语言的使用惯例。