第二节 蒙太格语法
蒙太格语法(Montague Grammar,简称MG)是美国著名的逻辑学家和哲学家理查德·蒙太格(Richard Montague)于20世纪60—70年代创立的一种用数理逻辑方法研究自然语言的形式语义学理论。它是在看到真值语义理论不足的情况下,直接面对自然语言提出的语义理论,是经典语义理论的又一座里程碑。
在蒙太格以前,大多数逻辑学家和语言学家认为由逻辑学家所发展起来的形式语言的句法和语义装置不可能应用于自然语言的分析。逻辑学家认为,自然语言充满了含糊性、多义性与歧义性,不适合形式逻辑分析。而语言学家认为形式语言的构造与自然语言毫无共同之处,不可能归属于可能的人类语言的范围之内。蒙太格的成就在于他“在语言研究的历史上架设起第一座宏伟的桥梁”。在他的论文《普遍语法》(Universal Grammar,简称UG)中第一句话就是:“在我看来,自然语言和逻辑学家的人工语言之间,没有重要的理论差别;的确,有可能把两种语言的语形和语义综合到一个单一自然的和数学上精确的理论之中。”《普遍语法》是构成蒙太格语法理论的广义代数框架,在此著作中,首次体现了把形式语义学应用到自然语言中去的思想。在《作为形式语言的英语》(English as a Formal Language,简称EFL)一文中,蒙太格明确地为自然语言和形式语言的相似性而辩论,不同意自然语言和形式语言之间存在着重要的理论差异的观点。在其代表作《普通英语中量词的特定处理》(The Proper Treatment of Quantification in Ordinary English,简称PTQ)中,蒙太格提出了一个分析部分英语语句语义的系统,定义了句法和语义,把英语短语翻译成基于内涵逻辑的、能用塔斯基的模型论来解释的逻辑表达式。这是蒙太格语法的具体运用。道蒂(Dowty)认为PTQ“代表着蒙太格艰苦努力地把在数理逻辑中发展起来的技巧用于自然语言语义学所达到的顶峰”。“蒙太格语法”是一个术语,指的是建立在上述三篇论文基础上对自然语言的句法和语义进行研究的理论。主要包括三个方面:首先精确分析自然语言的句法,构建一个部分英语语句系统的句法部分;其次建构一个内涵逻辑系统,给出这个系统的语形和语义;最后建立翻译规则,通过这些规则实现人工语言和自然语言的对应,使得自然语言获得语义解释。蒙太格在形式语义学中开天辟地的工作为语言学家和逻辑学家开创了新的研究领域。
一 句法
句法由句法规则和句法运算(operations)组成。句法规则由基本的或递归的分句的句法范畴构成,是自然语言中由词条形成词组短语最终形成语句的规则。句法运算是解释范畴如何形成新的词组短语的相互关联的函数。
(一)句法范畴
句法范畴基于语句表达式t和个体表达式e两个基本范畴。前者表示真值的语言单位,相当于陈述句,后者表示名词和个体变元。t范畴不包含词项,是由通过递归规则构成的句子组成的。标志t表示范畴的所有成员都包含了一个真值。基本范畴e实际上不包括任何实体,它的使用不在于词组短语的范畴化,而在于表征语义信息。例如t/e,其中的斜线表示函数,斜线的左侧是值域中的值,右侧是定义域中的个体,t/e表示从实体的意义到真值的函数。
除了两个基本范畴,其他范畴都是派生的范畴,是在基本范畴的基础上使用函数方式定义的。通过基本范畴t和e,能产生无限多的形如X/Y的范畴。其中X和Y是范畴,Y是一个能够被用来引起X短语的短语。为了描述这样一个事实,同一范畴类型可以描述比句法范畴更多的东西,我们可以用增加的斜线进一步把句法范畴分开。例如,t/e和t∥e可以表示一个e短语引起一个t短语的两个不同的范畴。
在表2-1中,除了两个基本范畴,蒙太格列出了九个句法范畴。为了简单起见,蒙太格对前五个句法范畴使用了缩写。例如,TV表示(t/e)/(t/(t/e))。
表2-1 句法范畴
(二)句法规则
每一个非基本句法范畴都包含词汇规则和递归规则。词汇规则只说明词汇短语的范畴。为了生成一个新的语法,我们首先根据句法范畴将词汇分类。词汇成员所产生的集合被称为范畴的基本表达式。语词“片段”(fragment)指的是一种语言的一个有限子集。蒙太格语法只研究了部分有限的英语语句,没有研究所有符合语法的英语语句。
令A是上述任一范畴,BA表示范畴为A的基本表达式。那么对于九个句法范畴的基本表达式,可以用集合的方式逐一列举如下:
1.BIV={run, walk, talk, rise, change}
2.BT={John, Mary, Bill, ninety, he0, he1, he2, …}
3.BTV={find, lose, eat, love, date, be, seek, conceive}
4.BIAV={rapidly, slowly, voluntarily, allegedly}
5.BCN={man, woman, park, fish, pen, unicorn, price, temperature}
6.Bt/t={necessarily}
7.BIAV/T={in, about}
8.BIV/t={believe that, assert that}
9.BIV/IV={try to, wish to}
每一个形如X/Y的句法范畴都有一个对应的递归句法规则,即:
如果a∈X/Y, β∈Y,那么Fi(a, β)∈X。
大部分递归规则都是像Fi(a, β)=aβ这样简单地串联起来,但有些更加复杂一些。例如:
我们可以举些例子说明一下:
F3(shave, a fish)=shave a fish
F3(seek, hei)=seek himi
F3(read a large book, Mary)=read Mary a large book
在这条规则中,如果β是hei,那么我们要把hei转换成himi。F3(a, β)中的下标3指的是它对应的范畴BTV表达式的序号。
词汇规则和递归规则可以被用来生成基本表达式和句子。句法规则是从词汇层次开始对组成成分逐次进行组合,蒙太格语法的树形图便反映了这种组合过程,它自下而上生成句子,树形图的最上层是句子。
二 语义
在蒙太格语法中,语义表达式就是内涵逻辑式。语义部分含有一个内涵逻辑和若干翻译规则。从句子到内涵逻辑式的转变由翻译规则来完成。然后再按照内涵逻辑的模型定义给出翻译句的内涵逻辑式的真值条件,最终便得到了句子的语义解释。
(一)内涵逻辑和类型
在模型中给语言表达式以解释,就是指把个体对象指派给个体词,对象序列的集合指派给谓词,真值指派给语句。这些个体对象、对象序列的集合和真值分别是个体词、谓词和语句的外延。内涵是指语言表达式与其所指对象之间的指称关系。由于外延指的是特定世界中的特定对象,因此,谈论内涵就要涉及“世界”或“可能世界”。我们具有关于一个表达式的内涵的知识,实际上我们就获得了一种工具,运用这种工具于某个可能世界,就可以准确地识别出该表达式在该可能世界中的外延。正是在这个意义上,我们说,语言表达式的内涵先于它的外延,并且决定着它的外延,或者说,内涵是从可能世界到外延的函数。外延逻辑是通过明确语言表达式的外延来分析其语义,组合性原则是它的一个主特征,即“一个语句的真值是由它组成部分的真值决定的”。但外延逻辑在对自然语言进行分析时遇到许多疑难问题,这些问题大都跟语言表达式的内涵有关。如:
任何人都知道晨星是晨星,
晨星是暮星,
所以任何人都知道晨星是暮星。
这个推理是无效的,因为这个例子提供了一种内涵语境。尽管“晨星”和“暮星”事实上指的是同一颗星——金星,但有的人可能不知道这一点。因此,从它的两个前提得不出它的结论,显然是由于“知道”这样的特殊语词的出现改变了语句,使得语句的真值不再是由它组成部分的真值决定的,而是由各种不同的语境情况所决定——如不同的可能世界,不同的说话人、说话地方和说话时间等。我们称这样的特殊语词为内涵词。在内涵语境中,外延语境的组合性原则、等值置换规则、同一性替换规则在推理中失效。
用外延逻辑来分析受内涵词支配的语句的语义显然是不行的,蒙太格设计了一些技术性手段同时处理含义和所指,将内涵逻辑引入了语义学。在内涵逻辑中,表达式的语境表征可能的事态。表达式的语境被称为索引(index)。索引包括了世界、说话时间、说话地点、话语环境和其他相关的可变因素,是内涵函数变域的模型。语言表达式的外延可以被定义为它的内涵。语言表达式的内涵是从索引到表达式的函项。蒙太格认为“语句的内涵是从索引到真值的函数,个体词的内涵是从索引到对象的函数,谓词的内涵则是从索引到对象序列集合的函数”。在表达式前加上符号^,表示该表达式的外延就是它的内涵。
在蒙太格的内涵逻辑系统中,每一条规则都是一种类型(type),每一个句法范畴都有一种对应的类型。把句法范畴翻译成内涵逻辑语言的规则是:
如果α∈X/Y, β∈Y, α, β翻译为α′, β′,那么Fi(α, β)翻译为α′(^β′)。
我们把句法规则中的α, β译成α′, β′, Fi(α, β)译成了α′(^β′),其中变元^β′指的是β′的内涵。
如同句法范畴,内涵逻辑的类型也是基于t和e两个基本类型。类型t是语句,包含了从预先确定的模型和对变元真值的指派方面定义类型t表达式真值的规则。类型e是由实体组合的。所有的类型都是通过运用内涵逻辑的规则,从基本类型t和e中,递归地产生的。表2-2列举了递归地定义新类型的规则。
表2-2 语义规则
A、W、T分别表示个体、可能世界和时间的集合。Dx表示类型x的表达式的可能指称的集合。<a, b>是一个类型,是以a为定义域,以b为值域的一个函数。表达式<s, a>是类型a的一个短语,它的外延等于它的内涵,即类型<s, a>表示相应于每一个类型a的内涵。变元s是表示可能世界和时间的有序对,是各时空中外延的总和,也就是内涵。
根据表2-2中的规则4,我们可以定义上述列举的九个句法范畴中基本表达式中词汇的外延和内涵。与句法范畴X/Y相对应的语义类型是<<s, y>, x>,即以Y的内涵为定义域,以X的外延为值域的函数。比如语句的外延可以表示为类型<<s, t>, t>。语句t的外延是从可能世界和时间的有序对到真值的函数。<<s, t>, t>是从可能世界和时间的有序对到t的外延的函数。也就是说,<<s, t>, t>的内涵是以可能世界和时间的有序对为定义域,以从可能世界和时间到真值的函数为值域的函数。不及物动词短语walk,它的语义类型是<<s, e>, t>。外延是walk概念的集合,内涵范畴是<s,<<s, e>, t>,是一个从有序对<w, t>到walk外延的函数。
(二)量化和组合性原则
形式逻辑符合组合性原则,组合性原则指的是复合表达式的意义是组成成分的意义及成分组合方式的函项。自然语言不符合组合性原则。蒙太格运用内涵逻辑来处理名词词组缺乏组合性原则的问题。
在蒙太格之前,由于量词的存在,名词词组向语言学家提出了组合性的问题。这个问题可以在比较John talks(约翰说话)和Every student talks(每一个学生说话)的解释中得到说明。这两个句子有相似的句法结构和类似的意义,但译成一阶谓词逻辑时,却有很大的不同(见表2-3)。
表2-3 语句和它们的翻译
为了处理组合性问题,蒙太格从广义量词的角度分析名词词组,对广义量词进行句法运算,并借此解决量化结构的歧义表达问题,并给出了广义量词的语义解释。John是包含John这个个体概念的属性的集合。在内涵逻辑中,用范畴e的常元j表示John, John的内涵或个体概念是^j。John的一般量化是P′P{^j},即λP[P(j)],指的是John的个体概念的诸属性的集合。同样地,every student能够被看作是学生的集合的所有超集(supersets)的集合。量词词组的句法规则是:
如果α∈PCN,那么F0(a), F1(a), F2(a)∈PT,其中F0(a)=every a, F1(a)=the a, F2(a)=a/an a。
在广义量词中,句法规则用同样的方式来处理带有量词every, the, a或an的名词词组。量词词组的翻译规则是:
如果a翻译成a′,那么
F0(a)翻译成P′[(∀x)(a′(x)→P{x})]
F1(a)翻译成P′[(∃y)((∀x)[a′(x)↔x=y]∧P{y}
F2(a)翻译成P′[(∃x)(a′(x)∧P{x})]
用广义量词来解释,John talks和Every student talks都可用相似的方式来表征,谓语不再是talks,如表2-3所示。因为根据广义量词规则,当一个名称短语和不及物动词短语组合成一个语句时,名称短语被用作一个函数。因为tslks是一个不及物动词短语,名称短语John和every student都被当作函数。John′(^talk′)表示John的个体概念包含一系列的属性,在这些属性中,其中有一个属性是talking。相似地,every student′(^talk′)意味着每一个学生包含了一系列属性,在这些属性中,其中有一个属性是talking。蒙太格借鉴罗素的简单类型论,构建了高阶类型论的内涵逻辑系统。“通过引入类型概念,可将自然语言中的个体词与个体概念、谓词与谓词概念区分为不同层次,量词也随之进行相应分层,由此可在一个逻辑系统中对自然语言的种种复杂情况进行协调处理。”
为了把自然语言准确地翻译为人工语言,蒙太格引入了λ算子。λ算子的使用能够准确地将带量词的语句翻译成内涵逻辑语言。通过语义方面的类型论和句法方面的λ-表达式,蒙太格语法使自然语言语句的语义和结构形成一一对应,句法成分与语义成分之间是同态映射关系。也就是说,句法规则组合一次,相应的语义规则也组合一次,完全符合组合性原则。我们以著名的驴子句“Every farmer owns a donkey”为例。组成这个句子的语词有“every”、“farmer”、“owns”、“a”和“donkey”。与它们分别对应的形式表达式为:λPλQ∀x(Px→Qx), λx(farmer(x)), λФλxФ[λy(owns(x, y))], λPλQ∃x(Px∧Qx)和λz(donkey(z))。采用底层元素向上一步步组合的方式,经过λ-演算和中间化简步骤,最终得到整个句子的逻辑表达式为:∀x(farm(x)→∃y(donkey(y)∧owns(x, y)))。
(三)模型论语义学
模型论语义学是基于塔斯基模型论定义的真值条件的语义学。一个短语的真值条件是在该短语语境中参数的真值。参数是由变元组成,比如语句说出的时间和可能世界,在这个可能世界中,对于一个模型,该短语是真的。在蒙太格内涵逻辑中,这些参数用类型来表示。
模型论由逻辑常项、变项和非逻辑常项三种符号组成。逻辑常项指的是传统的逻辑符号,如:→, ﹁, ∧, ∨等。变项指的是某类特定事物中任意一个符号。非逻辑常项包括全称量词∀和存在量词∃、关系符号、函数符号和个体常元符号。一阶谓词逻辑语言包括以下三个特征:
1.能够给出这种语言的所有公式的集合的有穷的递归句法特征;
2.根据句法,能够给出满足所有公式的有穷的递归语义特征;
3.根据满足,能够定义真,通过这种方式,给出语句的真值条件的正确特征。
根据复合公式的组成公式,一阶谓词逻辑语言递归地定义复合公式满足的条件。语句的真值条件指的是这样的一些条件,在这些条件下语句被满足。语句在这些条件下是真的,是以使用的模型为基础。为了理解真值条件,我们必须先理解真的基本定义。真定义定义了变元和使一个表达式是真的模型之间的关系。
因为真定义是递归地定义的,所以首先必须存在基本的真。即:
基本规则:a满足F。
递归规则:a满足F∧G,当且仅当a满足F并且a满足G。
我们还可以得到后承、等值、永真式、矛盾式的定义。
后承:X是K中语句的后承,当且仅当X在K中每一个语句都是真的模型中都是真的。
等值:如果X是Y的后承并且Y是X的后承,那么X和Y逻辑等值。
永真式:如果对于所有的模型来说,X是真的,那么X是逻辑真的。
矛盾式:如果并不存在K中所有的句子都是真的这样一个模型,那么K是矛盾的。
根据蒙太格语法,真定义对应于解释语句片段(fragment)内涵的规则。内涵逻辑和量化的讨论处理了把语句翻译成内涵逻辑形式语言的过程。在内涵逻辑中,短语的内涵基于模型理论,把意义定义为模型的函项。模型就是索引。
三 语用因素
蒙太格语法在刻画语义时已经考虑到语用因素的作用,认为一个语句的真不但依赖所在的模型,而且依赖所具有的语境因素。蒙太格希望考虑自然语言中的“我”、“你”这样的代词和“这里”、“现在”这样的副词的出现。他接受了希勒尔提出的索引表达式理论——这类表达式的意义涉及使用的地点、时间等语用因素。并将地点、时间等作为语境引入形式语义模型。语境可以看作一个可能世界,一个时刻或一个处于某一时刻的可能世界。相关的内涵是一个从可能世界集到表达式所指称的对象集合的映射,于是可以用数学的方法研究语用学了。蒙太格的形式语用观是形式语义学关于语用问题研究的延伸。
与塔斯基的真值语义理论相比,蒙太格语法取得了一些新的进展。第一,将形式语义学推广到自然语言研究领域;第二,将外延语义推广到内涵语义;第三,将传统的语义学研究推广到语用学领域。但蒙太格语法仍然是组合性的静态理论。