一、相关概念及研究背景
(一)程式语概念
程式语作为普遍存在的语言使用特征,是指按照一定型式,整体存储在大脑内的固定或半固定的语言表达。埃尔曼(B. Erman)和沃伦(B. Warren)对程式语的研究表明,英语口语中存在58.6%的程式语使用,书面语篇中也存在52.3%的程式语使用。 (20) 比伯(D. Biber)也曾指出,在学术论文写作中,超过50%的语言使用都是固化词串或半固化词串及内部变体的表述(也就是说由2—3个固定词素和1—2个插入词素组成)。 (21) 程式语的使用渗透在各个语体、语域中,除上面提到的学术论文外,还包括法律语篇在内的各类专门用途语篇。但是,对于程式语概念的界定、划分标准及功能分析,目前仍存在较大争议。
因此,对于程式语进行研究的最大困难是缺乏内涵和外延判定的标准。在对程式语开展研究的40余年中,学者们尝试用不同术语去命名“程式”这一语义内涵,其中包括“语块”“词串”“公式化语言”等等。雷(A. Wray)和帕金斯(M. Perkins)首次提出“程式语”(formulaic frequences)这一术语,指出其本质为“整体储存在大脑中,使用时整体提取”的多词单位。 (22) 此后,一批学者尝试对程式语概念作出进一步规范,虽然定义各有侧重,但是语言学界关于程式语特性的认知是一致的。 (23)
学界一般认为程式语分为狭义和广义两种概念。在狭义理解上,考伊(A. P. Cowie)认为程式语是指固定或相对固定的,可以表达相遇、赞美或邀请等等话语行为的结构。 (24) 随后考伊又进一步规范了狭义程式语的描述:“程式语是用于语篇中,可以表达说话者的态度,并等同话语标记语功能的固化表达结构。” (25) 显然,这样的定义仍不令人满意。随后,广义程式语的概念由雷提出,其表述内容如下:
(程序语是)存储在人脑中的词语序列(sequence),由连续或是非连续词语(有时无意义)及其他元素组成。程式语具有“整体使用”的特征,也就是在存储或使用时经常以“整体”形式出现的短语结构,而并非依据语法分析得来。 (26)
上述表述的最大问题是其过分宏观的定义将一些并不具有语言意义的单位都纳入其中。不过同时,也正是在这种情况下,语料库检索中的词串复现频率可以作为判定程式语最有效的途径,在此基础上结合人工筛选,便可获得较为准确的程式语型式,这也是本节所采用的研究方法。基于以上原因,文中采用广义程式语定义对其概念进行限定。