4.1 命题因子类型
命题因子有属性和值两个部分。一个命题因子和其他命题因子之间的关系由这两个部分来共同决定。命题因子之间的关系有两种:横向关系涉及命题内和命题之间的函词/论元结构、并列和共指等语义关系;纵向关系涉及说者模式下和听者模式下的语言和语境命题因子之间的指代关系(见3.2.4)。
数据库语义学只用三种基本的表现命题内容的命题因子来对这些关系进行编码。这三种命题因子从本体论上看分别表示(i)物体、(ii)关系、(iii)特征注54。表现在语言上则分别代表(i)名词、(ii)动词、(iii)形容词等不同词性。与之对应的逻辑学上的说法是(i)论元、(ii)函词、(iii)修饰语。
这三种基本命题因子之间的区别通过其核心属性(i)noun,(ii)verb、(iii)adj来表现。除了核心属性之外,各个命题因子的其他属性有的相同,有的不同。如下所示:
4.1.1 三种主要命题因子示例
命题因子的属性分类如下:
4.1.2 命题因子以及属性
1. 语表属性:sur
所有命题因子都有语表属性。如果一个命题因子的语表属性的值为“NIL(空)”,那么这个命题因子是一个语境命题因子。语言命题因子的语表属性有一个来自词典的非空值。
2. 核心属性:noun,verb,adj
命题因子的核心属性有一个唯一的值,这个值来自词典。从符号理论的角度看注55,核心属性值可以是和三个符号种类——标志、指示词和名称相对应的概念、指针或者标记。
3. 语法属性:cat,sem
语法属性“cat(category)”和“sem(semantics)”从词典当中得到初始值,之后在求导过程中不断调整。
4. 命题内接续属性:fnc,arg,mdd,mdr
命题内接续属性在命题因子的时间线性生成过程中通过复制操作得到值(见3.4.2)。接续属性的值由代表其他命题因子名称的字符(char)构成。被分析过的命题的各个因子的属性“fnc(functor)”、“arg(argument)”和“mdd(modified)”(必要接续属性)都不能为空,而属性“mdr(modifier)”(可选接续属性)的值可以为空。
5. 命题间接续属性:nc,pc,idy
命题间接续属性“nc(next conjunct)”、“pc(previous conjunct)”和“idy(identity)”用来表示命题内部关系和命题间关系。在表示命题间关系的时候,它们是必要属性(对于同一个文本,这几个属性当中,至少有一个的值不为空);表示命题内关系的时候,它们是可选属性,其值和命题内接续属性的值一样,通过复制操作得到。注56
6. 簿记属性:prn
簿记属性“prn(proposition number)” 的值是一个数字(整数),通过分析器的控制结构(control structure)获得。其他簿记属性有“wrn(word number)”和“trc(transition counter)”,用来满足相应的具体需求。
简便起见,下面的讨论中,省略不相关属性。
为了在某些规则中对属性和属性的值进行归纳,以及满足词典设计的需要,数据库语义学用取代变量(replacement variable)RA.n来表示属性,用RV.n来表示属性的值。取代变量和绑定变量(binding variable)(如3.6.8中的α)不同,它不绑定任何值,而是被值取代。以取代变量RA.n为核心属性值的词命题因子(lexical proplet)称作命题因子壳(shell)。
4.1.3 用核心值来替换取代变量
用概念apple来替换命题因子壳的核心属性“noun”的值,即变量RV.1,得到一个词命题因子。
如果命题因子壳中的取代变量被一个绑定变量所取代,那么得到一个可以匹配词命题因子的规则格式:
4.1.4 命题因子壳、词条和规则格式之间的关系
命题因子壳、规则格式和词条之间的区别仅仅在于其核心属性值各不相同。命题因子壳的核心属性值是取代变量“RV.1”。词条的核心属性值是概念“apple”。规则格式的核心属性值是可以在规则应用过程中绑定任一核心属性值的绑定变量“α”(见3.4.3)。
命题因子的内容用核心属性值来表示。命题因子的组合信息则用(i)必要的接续属性,如“fnc”,(ii)可选接续属性,如“mdr”,(iii)簿记属性,如“prn”。这样,通过不同的属性来表示内容和组合信息,就可以脱离内容而相对独立的处理组合信息,也可以脱离组合信息而相对独立的对内容进行加工。
处理命题因子的组合信息时,其核心属性值可以用占位符,也就是没有明确所指的名称(如概念)来表示。但是,实用的交流模型(机器人)的核心属性值必须要有详细的说明,而且该说明要具备与之相应的程序。
例如,我们向机器人展示一些具备不同几何形状的物体,然后给它指令,让它拿起一个方形的,那么它必须能够(i)在语言层面理解方形这个词,同时(ii)在语境层面识别这个形状,再(iii)把语言意义和相应的语境中的所指联系起来。作为符号,方形这个词属于标志,其核心属性值是一个概念。
相应地,如果[noun:apple],作为一个命题因子的核心特征出现,那么值“apple”就不仅仅是一个占位符,而是一个能够用来识别适当的所指的概念。为此,这个概念必须能够被认知主体(机器人)有效地识别出来。