历史比较语言学理论:从同源论到亲缘度
上QQ阅读APP看书,第一时间看更新

第一章 格林伯格的假说及方法论

第一节 非洲语言研究

一 格林伯格其人

格林伯格(Joseph Harold Greenberg,1915—2001),20世纪美国最具独创性和最有影响的语言学家和人类学家。他通晓多种语言,一生著书颇丰,特别是在发生学领域。作为语言学家,他获得了广泛的赞誉,是第一个入选美国国家科学院的语言学家,还曾担任美国语言学会主席等职。他在当代语言学领域的主要贡献是发展了一套研究语言的独特方法,而且在社会语言学、语言心理学、语音学和音系学、形态学、特别是非洲语言研究等方面也做出了巨大贡献。他的研究兴趣主要集中在两个领域:一是语言类型学,他是世界语言类型学的主要奠基人之一;二是语言发生学,他这方面的研究差不多涉及大半个地球的语言分类。格林伯格讨论语言发生学最重要的论文已由William Croft汇编,牛津大学出版社2005年出版,书名为《语言发生学——理论与方法文集》(Genetic Linguistics:Essays on Theory and Method),2009年由牛津大学出版社授权世界图书出版公司北京公司独家出版,江荻导读。格林伯格其他研究领域的论文已于1990年收入另一本由Keith Denning和Suzanne Kemmer 主编的文集《论语言》(On Language)。

格林伯格热爱音乐,迷恋语言。他学习了希伯来语、拉丁语、德语、古典希腊语、古典阿拉伯语、阿卡德语和各种斯拉夫语、豪萨语,参加“二战”时自学了意大利语。60多岁时开始学习日语,到了80多岁,他竟能看懂阿依努—日语词典中的大多数日语词。

大学时学习了很多学科的知识,如比较语言学、人类学、美洲印第安语言、美国结构主义、逻辑实证主义,还研究了 Whitehead和罗素的《数学原理》(Principia Mathematica)。逻辑实证主义对格林伯格产生了重要的影响。“二战”后从欧洲来的Jakobson和Martinet组建纽约语言学学会(Linguistic Circle of New York)。格林伯格通过他们接触了布拉格学派结构主义,了解了Trubetzkoy的标记论研究。

因此,格林伯格非常熟悉当时语言学、哲学和人类学的主要流派:美国结构主义、布拉格学派结构主义、历史比较语言学、逻辑实证主义和文化人类学(还不包括他的古典语和闪语背景以及他博览群书的能力)。那时,美国第一个语言学系正在建立,而格林伯格对于把语言学建成为一门独立的学科做出了极大贡献。

格林伯格的研究领域很广,1968年著有《人类语言学导论》,写过许多关于非洲语言的论著,其中1963年的《非洲语言》是对非洲语言进行系统研究的成果,书中对非洲语言的分类已为许多研究者所接受。他还把人类语言学的研究成果同普通语言学结合起来,在观察和比较了大量语言材料之后归纳出人类语言的一些普遍现象,从而开创了类型学研究的新局面。在这方面他撰写和主编了几部重要著作:1963年的《语言的普遍现象》,1974年的《语言类型学的历史概况和分析综述》,1978年的《人类语言中的普遍现象》。其中《语言的普遍现象》一书中提出的语言普遍现象有30多项,最后一本书分为4卷:第1卷为类型学研究的历史和理论;第2卷为语音类型学;第3卷为词语结构类型学;第4卷为句法类型学。

他退休后的研究重心转移到语言发生学分类的研究上。继早期的非洲语言分类研究之后,格林伯格又对美洲、澳大利亚以及世界其他地区的语言进行分类。2000年他的专著《印欧语和它的亲属语:欧亚语系》(第一卷:语法篇)出版。2001年3月中旬第二卷完成。他原本打算详细研究地球南部的语言,包括尼日尔—科尔多凡语系、尼罗—撒哈拉语系、埃兰(Elamo)—达罗毗荼语系、印度洋—太平洋语系和澳大利亚语系,可惜没时间了。

格林伯格曾获得很多荣誉:两次成为行为科学高级研究中心的研究员,三次获古根汉基金奖,曾是美国哲学学会会员和美国国家科学院院士,担任过美国语言学会会长,非洲研究协会会长,西非语言学协会会长,LSA学院科里兹分院(Collitz)教授。格林伯格曾给美国人类学协会做过一次精彩的演讲。获得过非洲研究海塞拉西奖(Haile Selassie),行为科学纽约科学院奖,社会科学美国艺术与科学学院帕森斯奖(Talcott Parsons)。

尽管从一开始格林伯格的观点和研究方法就饱受争议,但是他严谨的治学态度、十年如一日的笔耕不辍值得我们学习。他知识渊博却不张扬,记忆力超群,世上无几人能做到。

在历史比较语言学这一学科范围内,学者们研究语言分类的热情有增无减。根据研究方法可以把这一领域的学者分成两个派别:“区分派”(splitters)和“堆积派”(lumpers)。区分派强调,根据语言之间的细微差别,尽量将语言分成较小的群体。如果没有找到一些语言之间的相似性,是不能把这些语言划到同一个语系的。而这些相似之处正是用于构拟假定语系原始语的基础。堆积派强调,可以规定一些标准,根据这些标准把许多语言划分为几个大的语系。尽管某些堆积派人士也构拟原始语,但有人认为此举纯属多余,毫无意义。

1963年,“堆积派”的代表人物格林伯格出版了有名的著作《非洲语言》。在这本著作中,他首次应用“多边比较法”对语言进行分类,而没有采用传统的历史比较法来进行非洲语言的历史构拟。多边比较法不是比较一对语言,而是同时对比许多语言中的一系列单词,这是历史比较语言学研究的重大转折。长久以来,格林伯格的非洲语言分类是非洲语言谱系分类毫无争议的标准。与他早期对非洲语言的研究相比,他的研究方法已经从之前较保守的、区分的分类法转换到现在“高度堆积的”方法。

二 非洲语言的特殊性

非洲语言除了阿拉伯语、马尔加什语(Malagasy)、布尔语(Afrikaans)、英语、法语、西班牙语和葡萄牙语外,还有无数其他的语言。

常见的泛非洲语音特征包括[1]:(1)存在一些音素类型,如内破音/缩气音(implosives);(2)双连接的唇腭塞音如/kp/和/gb/;(3)鼻音前辅音;(4)吸气音(clicks);(5)较低前元音(次闭元音 near close vowels):/ʊ/和/ı/。

非洲语言里不常见的音素类型是小舌辅音、双元音和圆唇前元音。

非洲语言有个通用的词,即表示动物和肉的单词nama或nyama,在分歧严重的非洲语言里特别普遍。非洲语言通用的句法结构是:使用形容词性动词和通过动词“超过”(to surpass)表示比较。

有声调的语言在全世界普遍存在但是非洲特别多。尼罗—撒哈拉语系和克瓦桑语系都是有声调的语言。大部分尼日尔―刚果语言也是有声调的。奥罗莫语(Oromoo,又称阿方奥罗莫语 Afaan Oromoo,旧称盖拉语Galla)、乍得语和亚非语系的库希特南北语支都发现了有声调的语言。最普遍的声调系统有两种:高调和低调,有时出现曲折调(contour tones)。曲折调可分析为一个音节上连续出现的两个或多个声调。还有连续音变(tonal sandhi)现象,如声调扩散、音色转换、降阶和语调下降等在非洲语言里也是非常普遍的。

非洲语言情况复杂,语言和方言混杂在一起,难以区分,导致分类差别很大。据美国学者Welmers,[2]和格林伯格估计,非洲语言数量应该不少于800种,而Voegelin认为有1140种,Maho[3]认为有1441种,还有人更夸张,认为有2058种,这样的数量要占世界语言的30%。[4]在非洲,似乎仅存在两大语系:闪含语系(闪语与含语的关系毋庸置疑)和苏丹语系(局限于西苏丹语支和班图语支,可能有一天会包含所有其他的非含语)。另外在非洲大陆还存在一些尚未确定的语言或方言,这使得当地的语言分类更是乱上加乱。还有,语言名称混乱,如有的是本民族自称,有的是外人所加的称呼,有的是地理名称和民族或部落名称同语言名称相混。以上种种原因导致语言数量难以确定。此外,混合语的大量出现也是原因之一。在非洲,混合语现象相当普遍,有的甚至发展成一种民族语,如中非的桑戈语(Sango),南非的布尔语(Africaans)等。有人甚至把东非的豪萨语和斯瓦希里语也看作混合语。殖民地时期英语、法语对当地语言的影响也产生了语言混合现象。这种纷繁复杂的景象给研究工作带来诸多不便,因而简化语言分类已成当务之急。

虽然目前对非洲语言的研究已取得一些进展,但都无法在质量上和数量上达到欧亚语言研究的水平。有些语言只留下不准确的语法记载,或者只是片段研究,或者只是发表的一两篇文章。有的语言,只有一份词表。大多数语言什么都没有。造成这种状况的原因概括起来主要有以下几个方面:(1)研究的学者很少;(2)非洲语言太多;(3)大多数语言没有记录;(4)相邻语言长久的接触;(5)语言的大量消失。不过最主要的原因在于,一些语言长期毗邻而居,相互影响,相互借用。除了词汇借用,其他特征也能借用。如某地特有的发音特征,如班图语南部的吸气音,也能扩散到其他地方。埃塞俄比亚语的句法特征,也由前缀形式占主导地位变为后缀形式占主导地位,这些都跨过语言和语系的边界进行扩散。语言间的长期接触导致互借现象普遍,许多语言特征难以找到源头。如非洲东部高地地区,亚非语系操不同语言的人历史上就杂居在此,非洲南部班图语和克瓦桑语在不同时间段、不同地区混杂,而乍得湖之南的广阔地区,操中苏丹语、乍得语和阿达马瓦—乌班坚语的人长期混居。不同语言长期交融混杂,使我们无法辨别真正的原始语。另外,非洲许多较大规模的语言合并了小语言。小语言的消失并不能完全抹杀它的存在,它可能在底层留有一些痕迹,这也会给研究增加一定的难度。还有,许多现代语言或者它们的祖语,在某地已存在千年,这就意味着它与其他语言肯定有过接触,并已改变了许多本身固有的特征,让人难以了解某些特征到底源于何处。[5]

因此,虽然某些非洲语言具有一些共同点,但由于上述种种原因,一些共同特征并非同源所致。相反,有些可能是由于语言接触(导致借用),某些熟语和短语的类似也可能是由于相似的文化背景造成的。

虽然困难重重,难度很大,一些学者仍致力于非洲语言的研究。最早进行语言分类研究工作的是Lepsius、F.Müller和Cust,他们开创性的工作为后来的研究打下了坚实的基础。随后Carl Meinhof(1857—1944)的研究推动了人们了解非洲语言的热情。而Meinhof的研究是通过Werner的《非洲语系》[6]了解到的。Meinhof,出生于德国波美拉尼亚省鲁根瓦德(Rügenwalde)地区附近的巴兹威兹(Barzwitz)。他先后在图宾根大学(Tübingen)和格拉夫瓦尔德大学(Greifswald)上学。1905年Meinhof成为柏林东方学院的一名教授,主要研究班图语、科尔多凡语、布须曼语、科伊科伊语(Khoikhoi)和含语,成绩卓著。长期以来他的语言分类是非洲语言分类的标准。这种情况一直持续到1955年格林伯格的出现。

1955年,格林伯格发表了《非洲语言分类研究》,1963年出版了《非洲语言》。在这两部著作里格林伯格从全新的视觉探讨了非洲语言分类问题,推翻了Meinhof的理论,撼动了Meinhof在非洲语言分类研究的霸权地位,在学术界引起极大的轰动。自此格林伯格声名鹊起,并取代Meinhof成为非洲语言分类研究的权威人物。当然,假说最初提出时遭到传统势力的激烈反对,特别是他的方法论―多边比较法,让人难以接受。不过后来学者们慢慢接受了他的理论,他的非洲语言分类成为以后学者们研究的标准。

三 非洲语言研究的三个时期

对于非洲语言系属分类的研究,大抵可分为三个时期。第一时期就是后来被称为德国学派的兴起时期,以Westermann和Meinhof为代表,那时的研究很粗浅,历史比较法无用武之地,自然就没有语系、语族这一说。Meinhof把非洲语言分为五种:闪语、含语、班图语、苏丹语和布须曼语。Westermann的分类也是五种,但有点不同,除了班图语、苏丹语和含语相同外,其他两种是尼罗语和克瓦桑语。不过二者的分类都是依据语言结构特征。苏丹语的特征是单音节、无性别、无声调、所有格在名词前。班图语多音节、有类前缀、用声调区分语法而非意义,所有格置于名词后,等等。对含语的划分,Meinhof是根据语法的性、极性和元音变化。他把班图以北非含语、非闪语的语言都囊入苏丹语中。这种类型学方法是当时理顺错综复杂的非洲语言最主要的途径。但是这种方法有个致命的弱点,它无法真正有效地对语言进行分类,如英语缺乏性变化和格系统就有可能导致它被排除在印欧语系之外,而西非Fō语和距离遥远的古代汉语有着大量的形态相似,据此似可入同一语系。[7]

此时期不得不提的还有一位学者Drexel,[8]他充分利用人种学文化圈思想(Kulturkreis)中有关语言学区域与文化地域之间的关系,对非洲语言进行分类。他把曼丁哥语的兰语支(lan)置于不同的语系,并认为喀麦隆境内分散的班图语邡方言(Fang)是由三个语言层构成的:乌勒语层(Wule,中苏丹语支,包括玛迪语、班高语(Bango)等),恩高—恩科图腾层(Ngo-Nke,大致与 Westermann 的克瓦语相关),班图语层。虽然语言学的分类有时也得依靠人类学方面的知识,但是完全依赖它是靠不住的。Drexel更多地依据人类活动,没有充足的语言学证据。以他之见,赫梯语、埃兰语(Elamite)、巴斯克语可能与乍得湖的卡努里语(Kanuri)、班图语都有发生学关系。Drexel根据所列出的词汇比较证据,断定富拉尼语和马来—波利尼西亚语同源,而这些证据充斥着儿语、来自阿拉伯语的借词以及让人无法相信的语义相似。后来的学者如施密特和Kieckers 在研究世界语言分类时,虽然利用了Drexel的非洲语言分类,但是排除了非洲大陆之外的语言。另一位学者Delafosse仅仅依据类前缀和类后缀系统,以及它与班图语类前缀的关系来对非洲非班图语、非含语进行分类。[9]

大约到了20世纪30年代,英国的非洲学派抬头,这就进入第二个时期,有人称为“琼斯—弗斯—鲍尔斯”时期,这是由于美国学者Boas等人对北美印第安诸语及印度洋—太平洋一带语言的分类提出了新的见解,导致英国学者对非洲语言重新进行分类。此时研究非洲语言的一些英国学者如Tucker和Bryan[10]等以弗斯的语言理论为指导,在前人的研究基础上,与南非学者合作,共同修订非洲语言的分类。他们主张把Westermann的苏丹语和含语合二为一,甚至把尼罗语也包含进去。另一些学者按传统观点把含语和闪语归为一类。“二战”后研究非洲语言的英国学者以伦敦大学东方和非洲研究学院和国际非洲研究所为中心,同德法学者合作,共同调查非洲语言,并出版丛书《非洲语言手册》。

第三个时期可以说是从“二战”后开始的。这时的美国逐渐取代英国在世界上的霸主地位,使得美国学者有机会到世界各地进行实地语言调查。这些学者以德、英、法等国学者的研究为基础,提出了新的观点。当然他们依靠的是描写语言学方法,使用类型学的综合比较,对非洲语言进行共时描写。在这些研究非洲语言的美国学者中,最具代表性的人物是格林伯格。

格林伯格最初的非洲语言分类是12个语族,其中7个是从大苏丹语言中分化出来的。他认为,多年来非洲语言分类观点的分歧,主要在于各家依据的出发点不同。他批评Meinhof的分类标准,不是依据语音相似就是依据语义相似,分类标准极不可靠。非洲语言中,“亚非语系”和“班图语”由于其特点显著而少有争议,其他非“班图语”的系属争议仍然很大。后来格林伯格对非洲语言分类又做了修改,分为六个语系:尼日尔—刚果语系、亚非语系、克瓦桑语系、沙利—尼罗语系、尼罗—撒哈拉语系、尼日尔—科尔多凡语系。格林伯格最后的非洲语言分类是四个,即亚非语系、克瓦桑语系、尼罗—撒哈拉语系、尼日尔—科尔多凡语系。

美国印第安纳大学人类学系的世界语言档案室负责人 Voegelin 夫妇在所写的非洲语言档案整理报告中,简明扼要地介绍了三个历史时期的非洲语言研究状况,指出系属分类问题的分歧所在。[11]他们在参照格林伯格观点的基础上,参考了德国学派和英国学派的主张,并且征询很多非洲当地人的意见,认为非洲语言的最初分类仍然是可取的。Voegelin的分类是:(1)尼日尔—刚果语系,包括13个语族;(2)尼罗—撒哈拉语系,包括9个语族;(3)尼罗—含语系,包括1个语族;(4)亚非语系,包括5个语族;(5)克瓦桑语系,包括2个语族。

Voegelin认为,从目前整个非洲学界的研究成果来看,非洲语言按这种方式分类还只是权宜之计,因为有许多同分类有关的问题尚有待深入研究。今后的发展也必将在分类上提出更新的看法。

当代学者的研究也取得了很大进展。格林伯格之后,又涌现了大量学者,如Berry和Greenberg[12]、Gregerson[13],Welmers[14]。还有一些学者,如Bender[15],Bendor-Samuel[16],Ehret[17],Heine[18]。此外一些学者用其他语言进行研究,如Alexandre[19]和Heine等[20][21]。有些学者[22]把非洲语言扩充为五个语系,增加了马达加斯加的马来—波利尼西亚语系。不过现在非洲语言分类的主流观点流行的依然是格林伯格的四分法。

本部分主要讨论格林伯格的非洲语言分类假说,前面说过,格林伯格最终把非洲语言分为四大类,确实给我们带来很多好处,如召集会议,编辑论文集,进行语言调查都可以此名义进行。如有定期举行的尼罗—撒哈拉语、亚非语和克瓦桑语国际会议,但是一些小语种如科曼语(Koman)、科侯语(Khoe)、阿洛伊德语(Aroid)、隆语(Ron)或克里雅克语(Kliak)等就不可能有。很多语言学家可能没听说这些小语种的名字,但很少有人没听说过大语系的名字。因此,格林伯格的分类给学界带来了很多便利。

四 格林伯格的非洲语言分类

格林伯格讨论了语言分类的方法论,提出了语言分类的三条原则:一是音义要相似;二是语言的大规模比较,而非两两比较;三是只考虑语言学证据。至于第一条,格林伯格认为音义二者必须兼顾,舍其一则不成立。他以Meinhof为例,Meinhof在对尼罗河西边的科尔多凡南部山区多种语言分类时,只注重形态证据,即有名词前缀的语言他称为前含语,没有则是苏丹语。如科尔多凡的三种语言:塔戈语(Tagoi)、图玛里语(Tumale)和特戈里语(Tegali)非常相似,但是 Meinhof把前面两种划入前含语,而把特戈里语归入苏丹语,就是因为苏丹语没有名词前缀。格林伯格批评道,Meinhof机械地使用结构标准或单一标准,没有认识到语言是一个不断变化的实体,没有了解到前缀也不是最基本的特征。

至于大规模比较法,因为以前没有哪个学者这样大规模地收集语言,因此当收集起来的语言特征在许多语言里不断重复出现,并且覆盖范围广,内含形态功能词、代词和最基本词汇时,那么共同起源就是唯一的解释,并可排除偶然相似词和借词。例如,两种语言偶然相似的几率很高,大约20 %,即含有同样意义的音义相似词为1/5。在第三种语言里出现的几率是1/5的平方,即1/25。那么在n种语言里出现的几率就是1/5n-1。换言之,随着语言比较的数量越大,偶然相似的几率就越小。如,仅仅比较英语和印度斯坦语,就不会发现它们属于同一语系。如果把它们与很多语言同时进行比较,就可确定它们的系属。格林伯格以八种语言的七个词汇为例,按照他的方法论——多边比较法,同时对这些语言进行对比,结果发现它们可分为两组:撒哈拉语系和尼日尔—刚果语系,说明了这种方法的可行性。

格林伯格认为,语言分类应排除其他标准,只靠语言学证据。目前分类最普遍的错误是根据应用的重要性、人口的范围以及地域和文化来划分语言。出现这种错误最重要的两个例子是:把班图语当作一个独立的语系;闪语归入闪含语系(亚非语系)。

第二条,大规模比较法与历史比较语言学的传统方法矛盾,引来了大批传统学者的攻击。第三条与之前非洲语言学家(最著名的是Meinhof,他根据类型学甚至种族来划分语言)的做法截然相反,开始时也遭到一些反对,不过后来大家基本上接受了这种观点。

基于这三个原则,格林伯格最终把非洲大陆的语言分为四大语系:刚果—科尔多凡语系、尼罗—撒哈拉语系、亚非语系、克瓦桑语系。由于缺乏证据,已消亡的语言梅罗伊语(Meroe)没有分类。马达加斯加语没有包含进来,因为它是马来—波利尼西亚语系的一个成员。这些观点都出现在格林伯格1963年的论文集《非洲语言》里,书中他提出了非洲语言的发生学类型,除了一些小的改动外,到今天它依然是最普遍接受的分类。此论文集是他1955年《非洲语言分类研究》(Studies in African Linguistic Classification)的扩写修改版,这部著作本身也是格林伯格在1949年至1954年间发表在《西南人类学杂志》(Southwestern Journal of Anthropology)上的八篇文章编辑而成的。1963年首次发表在《美国语言学国际杂志》(International Journal of American Linguistics)第29卷第1号上。1966年的第二版(由 Indiana University,Bloomington:Mouton &Co.,The Hague出版)作为独立的著作出版。

格林伯格改变了以往学者们的观点,把非洲语言分为四大语系,每个语系又分为一些小语支,如刚果—科尔多凡语系分为尼日尔—刚果语族和科尔多凡语族。尼日尔—刚果语族是个大语族,包括六个语支,即西大西洋语支、曼迪语支、古尔(也称沃尔特)语支、库阿语支、阿达马瓦—东部语支、贝努埃―刚果语支。该语族约有3.5亿人口,其中两亿说班图语,占总数的近60%。可见班图语在尼日尔—刚果语系(以及非洲语言)中的地位。

“班图”在刚果语中意为“人”。班图语是贝努埃—刚果语支最重要的分支,使用人口2亿左右。班图诸语言在所谓“班图线”以南地区通行,这条线从西边的喀麦隆一直延伸到东边的肯尼亚。班图语言最初可能起源于贝努埃河中游峡谷地带,后来扩展到东非的大湖区,再向南扩展到好望角。可以粗略地把班图诸语言分为中部班图语、东南班图语和西南班图语三支。从使用人口和地理分布来看,贝努埃—刚果语和班图语几乎没有什么区别。斯瓦希里语是最重要的班图语言,也是东非大部分地区使用的交际语。在班图诸语言中,使用人口超过100万的语言除斯瓦希里语外,还有祖鲁语、柯萨语、绍纳语、卢干达语和刚果语等14种。

班图语最值得注意的特点是:它们的名词类别系统都一致,也称为“押头韵的”一致关系。因为句子中邻接词的词首都有相同的音节作为前缀。此外在词汇上也有许多共同点。除了斯瓦希里语之外,其他班图语言都是声调语言。关于班图诸语言的声调,还有一种特殊现象,即存在着一个“相反声调区”。这个地区以刚果西部为中心,这里的语言词和句子的声调,与其他地区班图语言的声调正好相反:高调变低调,低调变高调。有些语言的前缀由一个音节构成,另一些语言的前缀由两个音节构成。南部非洲的班图语言从邻近的布须曼语和霍屯督语借来吸气音,祖鲁语和柯萨语尤其多。

班图语在非洲特别抢眼,有的学者鉴于班图语言数目庞大,每种班图语的使用人口同本语系别的语支乃至其他非洲语系相比,具有明显的优势,因此往往把它当作独立的语系来看待。但格林伯格认为,班图语不但不能称为一个语系,甚至不能称为一个语族,而只是尼日尔—科尔多凡语系尼日尔—刚果语族贝努埃—刚果语支下面的一个分支。班图语的研究可追溯至Brusciotto,1659年他发表了一部关于刚果语语法的拉丁文著作。[23]1856年,Bleek首次描写了班图语中的类名词,他也是首次引入班图语这个名称的人。[24]1860年开始许多语言学家对班图语的来源和演变展开研究。1880年埃及学家Lepsius在他的《努比亚语语法》一书中写道,非洲可以分为三个语言区(不过没涉及克瓦桑语):第一个区域是南非洲的班图语,真正黑人的语言。第二个区域是赤道与撒哈拉沙漠之间的混合“黑人语言”,所谓的苏丹语言。第三个区域是含语,包括北非的埃及语、库希特语族和柏柏尔语族。并认为苏丹语言的语法“缺乏形式”“退化”和“简化”。[25]

1901年Meinhof首次对非洲语言进行语法比较分析时涉及班图语。[26]他和他的学生都把班图语言看作一个独立的语族,并把它与苏丹语族并列。1948年Guthrie对班图语言进行分类并于1967年至1971年间将它分成16个区。他还构拟了今天所有班图语言的祖语―原始班图语。[27]这些学者的分类主要是依据班图语言的类名词系统和从西亚传入非洲的含语的性系统。

Meinhof在1905年至1935年间多次就班图语言的来源发表论文,他的理论与Lepsius和Schleicher的很不一样。对于他来说,班图语言不是原黑人语言,而苏丹语言才是原黑人语言。班图语言是黑人语言作为“母亲”、含语作为“父亲”产生的。按照Meinhof的理论,非洲是被三个语言层殖民的:黑人的苏丹语言、含语,而班图语言是前两者的融合。

Meinhof的学生Westermann认为苏丹语言与班图语言同出于一个黑人语言。从1948年开始他越来越相信西部苏丹语言与班图语言之间存在同源关系,并发表了多篇论文。他的这些研究为格林伯格提出尼日尔—刚果语系假说打下了一定的基础。1949年格林伯格提出把位于非洲西部和南部的语言统称为尼日尔—刚果语系,这个语系包括班图语,它们是一起从苏丹以西的一个黑人语言的核心中发展出来的。这个理论提出后,该语系的结构还进行了多次调整,最后一次是格林伯格在1963年的著作《非洲语言》里提出的。

格林伯格把班图语划入今天在尼日尔和喀麦隆分布很广的类班图语下面,由此他把班图语的发源地定为贝努埃河谷(尼日尔东部)和喀麦隆西部。今天大多学者同意该观点。但在1962年,Guthrie发表言论,认为原班图语是在赤道东南的热带雨林中产生的,从这里出发班图语呈放射状向今天的普及地区传播。他认为,一些操前班图语的人坐船向北离开了原始森林,所以今天在遥远的非洲西部仍然存在类似类班图语的语言。[28]今天这个理论已没人相信了。一般认为班图语的发源地是在赤道热带雨林以北,大多数学者支持格林伯格的东尼日尔—西喀麦隆理论。

格林伯格去世后尼日尔—刚果语系内部结构也被多次修改,但是在所有这些修改中(包括目前的版本)班图语始终被看作一个语支,与尼日尔东部和喀麦隆西部的类班图语支比较接近。

尽管班图语所处级别很低,但它历来是历史语言学研究的重点。班图语曾被用来检测从生物学借用来的分类技术(如Rexová等[29]; Atkinson等[30])。近年来一些学者专注于班图语的分类研究,如 Nurse和Philippson[31]、Maho[32]。当代一些对班图语比较研究做出贡献的学者有Nurse[33][34],Mouguiama-Daouda等[35],Marten等[36],Masele[37]和Schadeberg[38]

当代对尼日尔—刚果语的研究者包括:Olson[39]、Williamson 等[40]、Bendor-Samuel[41]、Blench[42]。其他综述还有:Bendor-Samuel等[43]、Williamson等[44]。最近有研究成果者有:Stewart[45]、Hyman[46]。当代尼罗—刚果语族分类如下[47][48]

图1-1 尼罗—刚果语族分类

假设尼罗―刚果语族有1000—1500种语言,对于历史语言学研究来说无疑是一笔巨大的财富。这个语族既包括一些有紧密发生学关系的语言,也包括一些有着远距离发生学关系的语言,还有一些存在疑问的语言。[49]现在有研究把科尔多凡语族归入尼罗—刚果语系之下,而非格林伯格的尼罗—科尔多凡语族之下。科尔多凡语族对于历史语言学家来说有着特别的吸引力,但是很少有记载,部分原因可能是很少有人愿意到苏丹南部调查。但是现在一些学者又对它产生了兴趣并重新进行分类,如Schadeberg[50]和Quint[51]。Schadeberg认为科尔多凡语族包括四种语言:黑班语、塔罗迪语、拉沙德语、卡特拉语,而 Quint和Dimmendaal[52]对卡特拉语隶属科尔多凡语族持怀疑态度。Quint认为少有记录的拉福法语是科尔多凡语族中四个主要语支的一个,而Schadeberg认为它是塔罗迪语。科尔多凡语族分类最大的变化可能是把格林伯格认可的九种卡都格里语从科尔多凡语里排除掉。现在的学者认为它要么属于尼罗—撒哈拉语系,[53][54]要么是一种孤立语。[55][56]另一种假说认为卡都格里语属于尼日尔—撒哈拉语系,即它是一种既含有尼日尔—刚果语特点又含有尼罗—撒哈拉语特点的语言。[57]

格林伯格的第二个分类是尼罗—撒哈拉语系。这一语系的居民主要分布在东非以及中部非洲以东地区,闪含语系各族的东南地区,人口较少,约2500万—3000万,包括4个语族和2种独立的语言:沙里—尼罗语族(Chari-Nile)、撒哈拉语族、马班语族(Maban)、科马语族(Coman)、富尔语(Fur)和宋海语(Songhai)。

现在学者如 Bender[58]、Ehret[59]、Dimmendaal[60]、Cuffer[61]与格林伯格的分类已经大不一样。由于Bender的分类[62][63]争议最大,现列出来:

图1-2 尼罗—撒哈拉语系的主要分支⑦

⑦ C.Ehret,“Is Krongo After All A Niger-Congo Language?”,in R.Vossen,A.Mietzner and A.Meissner(eds.),“Mehr als nur”,Worte Afrikanistische Beiträge zum 65,Geburtstag von Franz Rottland,Köln,Germany:Rüdiger Köppe,2000,pp.225 - 237.N.Cyffer,“Nilo-Saharan”,in J.Middleton & J.C.Miller(eds.),New Encyclopedia of Africa,Vol.3,London:Charles Scribner's Sons,2007,pp.233-237.

由于很少有语言学家能够熟练掌握三到多种尼罗—撒哈拉语,因此很难对这些语系假说进行全方位的评价。但是对于一些单个语系,一些学者进行了讨论分析。如 Bender 的尼罗—撒哈拉语系虽没有人抨击,但是外围语族(Outliers)却受到一些专家们的批评,如宋海语[64]、库里雅克语(Kuliak)[65]、撒哈拉语[66]。其他学者似乎对于他的分类不表达任何立场,但是却把格林伯格的分类展示出来,以表明格林伯格的分类是大众认可的分类。[67]

尼罗—撒哈拉语系绕核心语族(Satellite-core)的两个成员:佛尔语(For)[68]和中苏丹语[69]的同源关系也一直备受怀疑。甚至Bender的核心语族(core)的一个成员,古姆兹语,也受到怀疑,[70]最后连他自己都怀疑。[71]尼罗―撒哈拉语系其他语族的发生学关系可能不存在什么问题,这倒不是因为这些分类得到大家的认可,而是因为没人具有对这些证据进行检验的能力。少有人接受的语系成员是宋海语和库里阿克语,因此关于这两种语言的系属目前出现了很多的分类假说。[72]现在的一致意见是,尼罗—撒哈拉语系代表至少四个不同的语系,截至目前,尼罗—撒哈拉语系仅被认为是一个可供参考的语系名称,而非一个确定的语族或语类名。

最近有关尼罗—撒哈拉语系的比较研究工作包括较低层次的构拟:如Boyeldieu[73]、Bender[74]和Heusing[75]的研究。有些研究也凸显了语言接触关系,如Dimmendaal[76]、Storch[77][78]和Moges[79]。还有一些学者重拾旧观点,认为尼罗—撒哈拉语系和尼日尔—刚果语系构成一个超大语系。[80][81]

第三个语系是亚非语系,又称非亚语系、非洲—亚洲语系或阿非罗—亚细亚语系,旧称闪含语系(Hamito-Semitic)或闪米特—含米特语系,主要分布在亚洲西部的阿拉伯半岛和非洲北部。闪含语系或闪米特—含米特语系这个名称,来自《圣经》传说中挪亚的两个儿子的名字,圣经说他的儿子闪是希伯来人和亚述人的祖先,另一个儿子含是非洲人的祖先。

对于这个语系,格林伯格把它分为五个部分:闪语;古埃及语;柏柏尔语族(Berber);库希特语族(Cushitic);乍得语族。后面四个合称“含语族”(Hamitic Branch,不过格林伯格不认可“含语”这个术语)。

亚非语系的主要特征是:它是一种屈折语;辅音除了有清辅音和浊辅音外,还有一种重辅音,是在口腔后部和喉腔形成的;动词有人称前缀;有格和性的区别,但比印欧语系简单;词根基本由辅音组成。

亚非语系一些小语种最近成了历史比较研究的主题,如西里福特语(West-Rift),南库希特语[82],阿戈瓦语(Agaw,中库希特语)[83],比佑·曼达拉语A(Biu-Mandara A)[84],和隆语[85]。乍得语族的研究中心也已由分类转移到形式构拟,如名词修饰语[86]、位置格短语[87]、主语附着语素[88]和时体标记[89]。而语系内部以及语系之间的语言接触研究在大量作品中出现,如Jungraithmayr[90]、Azeb等[91]、Heine等[92]的文章。由于亚非语系语言数量众多,也就给学者们提供了大量素材,可根据今日的语言现状来挖掘过去语言接触的模式。

虽然现在的研究有了很大进步,一些小语种的研究成果日益丰富,但是这个地区的大多数语言没有古音构拟,也没有人做深入细致成熟的研究,导致这个地区的语言分类很不一致。格林伯格的分类有五种,现在有学者又重新分类,增加了几种少为人知的语言:奥摩语族(Omotic)[93][94]和翁戈塔语族(Ongota)。奥摩语族是一种充满矛盾和争议的语族,因为研究亚非语系的专家认为奥摩语缺乏亚非语里非常重要的语法构形成分。因此格林伯格和一些学者把它归入库希特语族。目前还有一种观点认为,奥摩语族有一种分布广泛的语言—阿洛伊德语(Aroid,包括Ari语、Hamer语和Dime语)事实上属于尼罗—撒哈拉语系。[95][96]大多数专家认为,奥摩语是亚非语系的一个下位语支。但这可能使一些人低估了大约25种奥摩语的内部多样性,这个数量比柏柏尔语族和闪语族还要多。

翁戈塔语是一种埃塞俄比亚语言,几近灭绝。2000年时只有8个人使用。[97]直到20世纪80年代这种语言才有记录的语言资料,并且只有少量的词汇和语法资料,导致分类困难重重,Bender称它为“埃塞俄比亚境内一种神秘的语言”。[98]翁戈塔语曾被认为是亚非语系一种主要的、独立的语支。[99]但是还有其他的观点,一种观点认为翁戈塔语可能是尼罗—撒哈拉语,或者是一种奥摩语,或者是某种混合语。[100]最使人信服的一种假说是,翁戈塔语是一种东库希特语,带有尼罗—撒哈拉语的底层。[101]换言之,翁戈塔人过去使用尼罗—撒哈拉语,后来转而讲库希特语,却保留了一些早期语言的特点。

第四种是克瓦桑语系,克瓦桑(Khoisan)这个名称来自学者Schapera,他把霍屯督人(Hottentot)的自称(Khoi)和布须曼人(Bushmen)的自称(San)结合起来。因此操克瓦桑语的人口主要是布须曼人和霍屯督人,以及非洲南部其他操非班图语的人。他们生活在西南非洲的半沙漠地带。此处使用的语言共约15种。格林伯格把克瓦桑语系分为北支、中支和南支。北支和南支都只有几种使用人口很少的语言;中支主要包括霍屯督语、布须曼语。此外,有些语言学家把坦桑尼亚境内一些小社团使用的哈扎语(Hatsa)和桑达韦语(Sandawe)也归入此语系,但其亲属关系较远。克瓦桑语言的突出特点是使用吸气音,并构成辅音的一个分系统。世界上只有克瓦桑诸语言以及相邻的几种班图语言,才在讲话中使用这种音。克瓦桑诸语言基本吸气音3—7个不等,可以分为:齿龈吸气音、舌边吸气音、舌面吸气音(又称卷舌吸气音)、齿吸气音、唇吸气音、半圆唇吸气音以及腭吸气音。吸气音通常位于词首。克瓦桑语言都是声调语言,有鼻元音。大多数名词、动词和形容词词根都是双音节的。某些语言如霍屯督语等,有与自然性别相一致的性。

现在大多数研究克瓦桑语系的历史语言学家都拒绝接受格林伯格的克瓦桑语系分类,[102][103]过去也是如此。[104][105]然而它却被认为是一种实用的分类,因为它把不相关的4个或5个语系放在一起,方便称谓。一些研究远距离语言发生学关系的专家(如Ruhlen[106],Ehret[107],Starostin[108])对一些批评置若罔闻,依然根据三种南非克瓦桑语言:科侯语(Khoe)、玖语(Ju)和图乌语(Tuu)继续克瓦桑语系远古语言的构拟工作。

克瓦桑语言构拟工作主要依靠一些濒危语言各个方言的记录。有些记录却使人更加混乱,如≠Hoan语没有文字记录,也没有人对其分类,如果说它是!Xóõ语的一种方言,最近的研究调查所得的结果却表明它与玖语有关系,[109]因此此地的语言研究非常麻烦。方言变体是解开语言接触复杂范式的钥匙,[110][111][112]可是由于大多数方言本身没有文字记录,研究起来也是困难重重。不过,令人高兴的是,一些学者根据最近的记录构拟出了古音,这在10年前几乎是不可能的事(如Elderkin[113],Sands[114])。

五 格林伯格非洲语言分类的优点和局限性

格林伯格对非洲语言的分类影响了非洲语言学界达半个多世纪。更多的学者在研究亚非语系和尼日尔—刚果语系,学者们对这两个语系的支持远远高于尼罗—撒哈拉语系和克瓦桑语系,而且正面的评价大大超过负面的批判。在那个时代,研究远距离语言比较的学者似乎都接受他的结论,可能是他们都使用同样的方法论,而且存在同样的问题,例如,他们都采用词汇的表面相似进行比较,而忽略有规律的语音对应;或者,语音似乎有规律地对应,但是语义对应又存在问题;语法项只使用单个或两个对比,而不是全范围比较;为了使词根看起来对应,就轻视词位。当然这些问题的产生是有一定的历史原因的,因为非洲语言的研究历史很短,资料极端欠缺,除了使用这种方法外,学者们也找不出更好的办法。

现在的比较研究总是根据更精确、更完整的语言描写来进行,而且通常集中于紧密联系的语言群或者特殊的语言子系统。当代学者对被比较语言的社会语言学和生态学环境的了解比格林伯格时代要多得多。人们也了解到语言接触、语言会聚和偶然性都可造成语言各个层面的相似。语法形位(grammatical morphemes)曾被认为是证明发生学关系的有力证据,现在我们知道,它们也可借用。

格林伯格对非洲语言分类之前,最广泛接受的分类要么是基于文化相似,要么是基于类型相似,或者二者都有。如Guthrie对班图语的内部分类主要是根据类型,完全与历史无关。[115]众所周知,之前的“含语支”包括所有非班图语的东非语言,有阳性和阴性之别。但这些标准被训练有素的历史语言学家指责为不可靠。不过这样的分类在格林伯格之前受到大多数研究非洲的语言学家的追捧,部分或主要的原因是与提倡旧式分类和坚持此标准的人的社会地位有关。

在这种已经固化的分类背景下,格林伯格打破旧规,他不强调类型或文化相似,而是强调词汇形式和意义的相似。根据他的方法,旧的“含语支”边界被打乱了,新的语支把一些“含语”和闪语联系起来。由于找不到确凿的资料,那些专门研究非洲语言的历史语言学家只好接受格林伯格的非洲语言分类,虽然有些分类可能只是暂时的,人们甚至还拒绝接受某些分类。

格林伯格最革命性的一步是假定了尼罗—撒哈拉语系。在这个语系里他识别了一个主要的下位分支沙里—尼罗语族,又称大苏丹语族,但是学界普遍拒绝接受这种分类。在较低层次,格林伯格根据Köhler[116]的假设,把尼罗—含语置于尼罗语支内。格林伯格还把科尔多凡努巴山(Nuba Hills)所有的非尼罗—撒哈拉语系的语言都归到单一的下位语支科尔多凡语族,并与尼日尔—刚果语系一起构成一个新语系——刚果—科尔多凡语系。对于尼日尔—刚果语族的大多数语支而言,通过比较法建立发生学关系的尝试是成功的,产生了丰富的词汇和语法系统对应的证据。不过人们仍然质疑曼德语支是否能作为尼日尔—刚果语族的一个成员,但其他分支却得到普遍认同。

格林伯格非洲语言假说证据最薄弱的地方是克瓦桑语系,此语系包括除班图语和库希特语族外所有的发吸气音[117]的语言。格林伯格对其他方面都进行了大幅修改,而克瓦桑语系从1950年提出到1963年专著出版一直没有变动。后来的克瓦桑语系也只是第一次的复制,格林伯格从一开始就相信这是个正确的语系,但事实并非如此。Westphal从格林伯格一开始发表关于非洲语言分类的文章到最后一年,即1966年,就发表了一系列文章表达了他本人对此语系的看法。[118][119][120][121]Westphal根据当时最新的资料,以及当时正在进行的克瓦桑南部地区的语言调查,有力地驳斥了格林伯格“堆积”起来的、用以证明克瓦桑语系假说的证据。可是不管是在当时还是以后格林伯格对于Westphal的反对无动于衷。可能有两个原因,一是格林伯格并没有充分证据证明他的假说,因为他不是专门研究克瓦桑语的学者,对克瓦桑语系的各种语言不熟悉。二是格林伯格对Westphal的挑战毫不在乎。研究非洲语言的学者Fleming也表示,不反对提出远距离发生学关系的假说,但是他认为,如果不能提供更充分的证据,就不该把桑达韦语和哈扎语归入克瓦桑语系。[122]Sands在格林伯格引用的哈扎语同源词中识别出1/3的错误。[123]

另外,格林伯格把非洲语言分为四种是远远不够的,主要有以下四个原因:一是他忽略了非洲大陆上的约27种手势语言,它们至少属于8种不相关的语系。二是他忽略了本地的但属于非洲大陆外的语系,如印欧语系和南岛语系的语言,这就意味着南非荷兰语和马达加斯加语不属于非洲大陆的语言,但是操这些语言的人大都居住在非洲大陆。三是现已识别出格林伯格时代没识别出的很多语言。四是不相关的语系数量巨大,至少有8种,还可能翻番。[124]

另外,非洲大陆还存在大量孤立语,而格林伯格对非洲大陆语言进行分类时却只字未提。下面的10种语言系属不明,现在还有一些有关它们的少量资料。

表1-1 一些可能的非洲孤立语③

③ Bonny E.Sands,“Africa's Linguistic Diversity”,Language and Linguistic Compass,Vol.3(2),2009,pp.559-580.

还有一些没有任何记录的孤立语,我们只知道有人曾经说过这种语言,但我们对此一无所知。有些语言,如班恩语(Bung)[125],可能在有资料记录之前就已灭绝。有些语言,如翁戈塔语[126]和科古语(Koegu)[127],直到最近才有人研究,并把它们分别归入库希特语族和苏米克语族。还有些语言只有少数人讲,他们居住在埃塞俄比亚西南,靠狩猎采集为生,这些语言受到相邻语言的强烈影响,难以归类。

一些语言,虽然长久以来一直位于此处,却与其他大陆的语言有发生学关系。如马达加斯加语,虽处非洲大陆却属南岛语系,它在马达加斯加已使用2000多年,并且至少与大陆的班图语有过两个时期的接触关系,[128]并在马达加斯加语的一些方言里留下了痕迹。[129][130]布尔语是来自印欧语系的荷兰语,后发展为一种不同的语言,现作为非洲几百万人的第一或第二语言。布尔语对大量南非语言的词汇产生了深远的影响[131]。还有成百上千的人说南印度语,他们好几代人都居住在东非和南非,如南非人说的泰米尔语(Tamil,一种达罗毗荼语)和印度—伊朗语(一种印欧语),比如古吉拉特语(Gujarati)、乌尔都语(Urdu)、比哈尔—印度语(Bhojpuri-Hindu)。[132][133]其他在非洲使用的印欧语包括前殖民时代的语言如法语、英语、葡萄牙语和德语。还有一些以印欧语为基础的混合语,如安哥拉尔(Angolar)葡萄牙混合语(Saotomense);西非葡萄牙混合语(Kabuverdianu),尼日利亚皮泾语。这些语言被很大一部分非洲人作为第一语言学习,而且被认为是非洲语言多样性的一部分。

格林伯格对非洲语言的分类具有重要的参考价值,但是作为语言发生学分类,它还存在一定局限性。首先是整个分类体系并没得到学界的完全认可,特别是克瓦桑语系。尼罗—撒哈拉语系和尼日尔—刚果语系的一些分类依然受到怀疑。另外他忽略了一些手势语、孤立语、本地的却属于大陆外的语系、很多没有识别出的语言。这些都会使他分类的准确性大打折扣。

不管怎么样,格林伯格作为首位尝试给所有非洲语言进行分类的语言学家,他的功绩是不可抹杀的。他不像那些前任,仅仅满足于一般的调查,而是做深入细致的研究,每一种情况所举例证都含有词汇对应、形态比较,甚至给出了地图。他不引用那些不可能的资料,也不引用那些很基本的、对专家来说很熟悉的资料。他会核实前任学者的发现,纠正一些错误,虽然很多东西又遭到其他人的反驳,但是无论如何,他的精细性和清晰性是无人能比的。可能他的某些观点和分类证明得不够充分,或是疏忽掉某些可能与其他语言有发生学关系的一些语言,为此他可能会受到批判,他的有些分类也会被人拒绝,但是所有这些都不会影响到他的研究价值。[134]总而言之,格林伯格假定的非洲语言分类是清晰的,就像一个研究非洲语言的专家说的,“(格林伯格)在充斥着成见和混乱的地方建立了秩序,一群充满感激的研究非洲语言的专家采用了他的说法,虽然他们知道有些地方是有问题的……他使专家们有了对不同语言互相交流看法的基础”[135]