花园幽径句行进错位的计算语言学研究
上QQ阅读APP看书,第一时间看更新

第二节 语音及词汇变异引发的花园幽径效应分析

在花园幽径效应的图式中,还包括语音、词汇同形异义和句法加工中的句式更迭等原因导致的效应解读。

语音相似或相同容易引发花园幽径现象,请见下例:

例36:The sky is blue and the /s n/ is bright for he really scores a notable success in an international tournament game.天很蓝,儿子很聪明;他在国际锦标赛中实实在在获得了巨大的成功。

在语音中sun(太阳)和son(儿子)具有相同的发音。理解模式由先期对景物天空和阳光的单纯描写sky-blue-sun-bright(天空—蓝—太阳—明亮),转变为对儿子心情的衬托sky-blue-son-bright-success-game(天空—蓝—儿子—聪明—成功—比赛),在语音上的回溯导致语音花园幽径现象的产生。

词汇的同形异义容易引发花园幽径现象,请见下例:

例37:The deer train the dogs.鹿训练狗。

Tagging

The/DT deer/NNS train/VBP the/DT dogs/NNS ./.

Parse

(ROOT

(S

(NP(DT The)(NNS deer))

(VP(VBP train)

(NP(DT the)(NNS dogs)))

(..)))

Typed dependencies

det(deer-2,The-1) nsubj(train-3,deer-2) root(ROOT-0,train-3)

det(dogs-5,the-4) dobj(train-3,dogs-5)

图21 例37依存关系图

例38:The dogs train the deer.狗训练鹿。

Tagging

The/DT dogs/NNS train/VBP the/DT deer/NNS ./.

Parse

(ROOT

(S

(NP(DT The)(NNS dogs))

(VP(VBP train)

(NP(DT the)(NNS deer)))

(..)))

Typed dependencies

det(dogs-2,The-1) nsubj(train-3,dogs-2) root(ROOT-0,train-3)

det(deer-5,the-4) dobj(train-3,deer-5)

图22 例38依存关系图

对比上面两例可知,两例中除了复数名词dogs和deer的位置发生了对掉外,词类、句子结构和依存关系都没有发生变化。

词类细化中,dogs/NNS和deer/NNS表示名词复数形式,train/VBP表示动词非三单现在时。

句法分析中,生成的结构是S(NP(DT The)(NNS dogs/deer))(VP(VBP train)(NP(DT the)(NNS deer/dogs)))。

依存关系图中,det(dogs/deer-2,The-1)表示限定词关系。nsubj(train-3,dogs/deer-2)表示名词主语关系。root(ROOT-0,train-3)表示根源于train。det(deer/dogs-5,the-4)表示限定词关系。dobj(train-3,deer/dogs-5)表示直接宾语关系。

例39:The train dogs the deer.火车追鹿。

Tagging

The/DT train/NN dogs/VBZ the/DT deer/NNS ./.

Parse

(ROOT

(S

(NP(DT The)(NN train))

(VP(VBZ dogs)

(NP(DT the)(NNS deer)))

(..)))

Typed dependencies

det(train-2,The-1) nsubj(dogs-3,train-2) root(ROOT-0,dogs-3)

det(deer-5,the-4) dobj(dogs-3,deer-5)

图23 例39依存关系图

例40:That deer dogs the train.那只鹿追火车。

Tagging

That/DT deer/NNS dogs/VBZ the/DT train/NN ./.

Parse

(ROOT

(S

(NP(DT That)(NNS deer))

(VP(VBZ dogs)

(NP(DT the)(NN train)))

(..)))

Typed dependencies

det(deer-2,That-1) nsubj(dogs-3,deer-2) root(ROOT-0,dogs-3)

det(train-5,the-4) dobj(dogs-3,train-5)

图24 例40依存关系图

上面两例的词类标注中,dogs/VBZ表示动词三单现在时,train/NN表示单数名词,deer/NNS表示复数名词。句法结构和依存关系都没有发生变化。

例41:The old dog dogs the deer.那个老狗追鹿。

Tagging

The/DT old/JJ dog/NN dogs/VBZ the/DT deer/NNS ./.

Parse

(ROOT

(S

(NP(DT The)(JJ old)(NN dog))

(VP(VBZ dogs)

(NP(DT the)(NNS deer)))

(..)))

Typed dependencies

det(dog-3,The-1) amod(dog-3,old-2) nsubj(dogs-4,dog-3)

root(ROOT-0,dogs-4) det(deer-6,the-5) dobj(dogs-4,deer-6)

图25 例41依存关系图

例42:The old dog the deer.老人追鹿。

Tagging

The/DT old/JJ dog/NN the/DT deer/NNS ./.

Parse

(ROOT

(NP

(NP(DT The)(JJ old)(NN dog))

(NP(DT the)(NNS deer))

(..)))

Typed dependencies

det(dog-3,The-1) amod(dog-3,old-2) root(ROOT-0,dog-3)

det(deer-5,the-4) dep(dog-3,deer-5)

图26 例42行进错位的依存关系图

上面两例对比强烈。例41是普通句,解码符合规则,没有行进错位产生。例42中,非优选结构替代优选结构并产生回溯,诱发了花园幽径效应的行进错位。

前例词类标注中,old/JJ表示形容词。dog/NN表示单数名词。dogs/VBZ表示第三人称单数动词。deer/NNS是复数名词。后例标注中,由于缺失了dogs,系统在处理The old dog the deer句子时系统仍然默认dog/NN的标注,并将(NP(DT The)(JJ old)(NN dog))剖析为名词词组NP,整个句子不再是完整结构,而是NP+NP的词组成分,系统剖析出现了行进错位。

依存关系分析中,前例amod(dog-3,old-2)表示old是dog的形容词修饰关系。nsubj(dogs-4,dog-3)表示dog是dogs的名词主语关系。dobj(dogs-4,deer-6)表示deer是dogs的直接宾语关系。后例在去除了dogs后,关系发生了变化,dep(dog-3,deer-5)表示dog和deer形成了依附关系(dependent),即当系统由于各种原因无法在两词间判定它们清晰的依存关系时采用的标注关系,例如在“Then,as if to show that he could,…” 中可表示为dep(show,if)。例42的这种情况还出现在下面的花园幽径句中:

例43:The strong train the weak.强壮的训练弱小的。

Tagging

The/DT strong/JJ train/NN the/DT weak/JJ ./.

Parse

(ROOT

(NP

(NP(DT The)(JJ strong)(NN train))

(NP(DT the)(JJ weak))

(..)))

Typed dependencies

det(train-3,The-1) amod(train-3,strong-2) root(ROOT-0,train-3)

det(weak-5,the-4) dep(train-3,weak-5)

图27 例43行进错位的依存关系图

花园幽径句例42和例43中,dog和train的名词、动词具有相同形式却表达为不同词性和词义的特征,为行进错位的出现埋下了伏笔。人工干预后两个句子可以形成正确的剖析结果。

Tagging

The/DT old/JJ dog/VBP the/DT deer/NNS ./.

Parse

(ROOT

(S

(NP(DT The)(JJ old))

(VP(VBP dog)

(NP(DT the)(NNS deer)))

(..)))

Typed dependencies

det(old-2,The-1) nsubj(dog-3,old-2) root(ROOT-0,dog-3)

det(deer-5,the-4) dobj(dog-3,deer-5)

图28 例42花园幽径效应依存关系图

Tagging

The/DT strong/JJ train/VBP the/DT weak/JJ ./.

Parse

(ROOT

(S

(NP(DT The)(JJ strong))

(VP(VBP train)

(NP(DT the)(JJ weak)))

(..)))

Typed dependencies

det(strong-2,The-1) nsubj(train-3,strong-2) root(ROOT-0,train-3)

det(weak-5,the-4) dobj(train-3,weak-5)

图29 例43花园幽径效应依存关系图

图28和图29显示,例42和例43的花园幽径效应依存关系图具有一致性。经过人工干预,名/动词同形的dog和train不再被剖析为名词,而被视为动词。如此不同的词类标注生成了与行进错位截然不同的句法结构,即生成了(S(NP(DT)(JJ)))(VP(VBP)(NP(DT)(JJ/NNS)))的完整结构,而不再是NP+NP的名词词组形式。相应地,依存关系也发生了变化,形容词old和strong替代动词dog和train成为限定词the的限定成分。