南开语言学刊(2015年第2期)
上QQ阅读APP看书,第一时间看更新

二  韵律匹配的研究方法和程序

2.1  实验方法

2.1.1  发音语料及发音人

本文实验分析所用的录音语料是参照石锋等(2009)文章中的实验语句。具体内容如下:

张中斌∥星期天∥修/收音机。吴国华∥重阳节∥回/阳澄湖。

李小宝∥五点整∥写/讲演稿。赵树庆∥毕业后∥到/教育部。

发音人共有4位,ZM1和ZM2为男生,ZW1和ZW2为女生,均为老北京人。录音在安静的环境进行,采样率为11025Hz。每位发音人都以自然状态平稳语速发音,不出现语义强调和情感色彩。每个实验句连续说3遍,句与句之间间隔4秒,共得到3×4×4=48个样品句。

2.1.2  实验数据的处理

韵律匹配一般是以语句中的字音数据作为依据进行相关计算的。本文使用南开大学“桌上语音工作室”(Minispeech-lab)对语音样品句进行声学测量,得到各字音的音高(Hz)、音长(ms)和音强(幅度积)的原始数据,通过公式计算,分别将以上三种参数转换为相应的起伏度、停延率和音量比。在此基础上,进行跨项自匹配和单项互匹配的分析,使用SPSS软件程序进行Pearson相关系数的计算。具体的计算公式和方法将在下文详细说明。

2.2  起伏度、停延率、音量比的计算

2.2.1  起伏度结果

起伏度测算是语调分析在音高方面的重要量化指标,是前一词调域的百分比数值减去后一词调域对应的百分比数值所得的差值。计算起伏度,首先把赫兹标度的音高数据转换为半音标度。然后是以半音数值为基础计算字调域的上线、中线、下线百分比数值,使不同发音人的实验结果在基频高低和调域宽窄方面的差异得到过滤,从而具有可比性。注9

通过测算,得到表1:

表1  4名发音人字调域百分比值

可以看出,4名发音人各单字的调域基本上呈现出相同的趋势,尤其是第3字、第6字、第7字以及末字的调域相对较大,汉语普通话陈述句中,各词韵律边界的调域都会发生不同程度的扩大。那么,这种同一性达到多大的程度呢?我们将4名发音人各字音调域分别进行了两两相关性的考察,通过SPSS进行Pearson相关性检验,结果如表2所示:

表2  4名发音人两两之间字调域相关度情况
b7

** 在 .01 水平(双侧)上显著相关。

* 在 0.05 水平(双侧)上显著相关。

如上表所示,单从相关性来看,4名发音人两两之间存在较强相关性,其中ZM1和ZW2之间的相关系数最高,达到了0.774,ZM2和ZW1之间的相关系数较低,但也超过了0.5,注10为0.512,达到强相关水平。加入显著性因素之后来看,除ZW1与ZM1和ZM2以及ZW2与ZM2之间以外,其余各处发音人两两之间均为显著相关。由此我们可以推断,汉语普通话的不同发音人,其语调各个字调域之间存在较强的相关性,内部匹配度较高。

另外,我们还可以得到各发音人的起伏度情况,以ZM1为例(如图1所示),可以看出该发音人的起伏度的总趋势是下降的,其中上线的波动幅度最小,中线次之,下线波动幅度最大,在末字降至0。

图1  ZM1起伏度情况

同样,我们也将4名发音人起伏度的上线、中线和下线进行了相关性分析,通过SPSS进行Pearson相关性检验,结果如表3所示:

表3  4名发音人两两之间起伏度上线、中线和下线相关度情况
b8

我们发现,单从相关性来看,4名发音人无论是上线、中线还是下线,两两之间相关性较强,除上线中,ZW2和ZM2之间的相关性较低外,其他各处相关系数均在0.5以上,达到了强相关水平。加入显著性因素来看,发音人两两之间的中线和下线均为显著相关,除ZW1与ZM2和ZW2与ZM2之外,上线其余各处也均达到显著相关。由此我们可以推断,汉语普通话的不同发音人,其语调起伏度之间存在较强的相关性,内部匹配度较高。

2.2.2  停延率结果

停延率测算是语调分析在时长方面的重要量化指标。需要测算出语句中各个字音的相对时长(ms)和每个语句的句子时长(ms),在此基础上利用以下停延率计算公式计算:

Dx=(Sx+Gx)/S#

其中Dx代表某个音节x的停延率,Sx代表语句中音节x的时长,Gx为该音节后出现的停顿,S#指的是语句中的音节平均时长。在单句内的字音一般只有延长没有停顿,因此Gx都为零。(孙颖、石锋,2009)

通过计算,得到了4名发音人的停延率数据结果,以ZM2为例(如图2所示),其第3字、第6字以及末字的停延率都比其他各字大,也就是说,在语句边界、词边界和字边界,这3个韵律边界前的音节均发生了延长;另外,不同声调之间其停延率并未表现出显著的差异性[F(3,36)=0.000,p=1],可见,声调的不同对于语句延长没有显著影响。

图2  ZM2停延率情况

同样,我们也将4名发音人停延率进行了相关性分析,通过SPSS进行Pearson相关性检验,结果如表4所示:

表4  4名发音人两两之间停延率相关度情况
b9

单从相关性来看,4名发音人停延率两两之间相关性较强,相关系数最高为ZM1和ZM2之间,高达0.91,最低为ZW2和ZM1,为0.632,也为强相关。加入显著性因素,我们发现4名发音人两两之间的停延率韵律匹配均为显著相关。我们可以推断,汉语普通话的不同发音人,其停延率之间存在较强的相关性,内部匹配度较高。

2.2.3  音量比结果

音量比测算是语调分析在音强方面的重要量化指标。它可以通过“南开大学桌上语音工作室”软件自动得出的幅度积计算得出,幅度积的大小与所选语音段的强度和时长成正比。语音强度很容易受到多种因素的影响,我们提出音量比的测算指标,通过字音幅度值之间的比值来消除偶然因素,使其相对化具有可比性。二字组的两个音节之间音量比具体算法为:(梁磊、石锋,2010)

音量比(E值)= 后字幅度积/前字幅度积

据此,仿照停延率的计算原则,设定对于语句中字音的音量比计算方法:

某字音量比=该音节幅度积/本句音节的平均幅度积

通过计算,得到了4名发音人的音量比数据结果,以ZW2为例(如图3所示),两位发音人的第3字和第6字的音量比较其他各字的都大,也就是说,在韵律边界处其音强会不同程度地扩大。另外,两位发音人在语句末字处的音量比都较小,低于0.8;与停延率相同,声调的不同对于语句的音量比并未表现出显著影响[F(3,36)=0.000,p=1]。

图3  ZW2音量比情况

同样,我们也将4名发音人停延率进行了相关性分析,通过SPSS进行Pearson相关性检验,结果如表5所示:

表5  4名发音人两两之间音量比相关度情况
b10

单从相关性来看,4名发音人音量比两两之间相关性较强,除ZW2和ZW1之间的相关系数仅为0.237外,其余均为强相关,相关系数在0.5以上。加入显著性因素来看,除ZW1以外,其他3名发音人两两之间的音量比韵律匹配均为显著相关。我们可以推断,汉语普通话的不同发音人,其语调音量比之间存在较强的相关性,内部匹配度较高。

2.2.4  小结

4名发音人两两之间的起伏度、停延率、音量比多达到了强相关水平,且多为显著相关。纵观几处非显著相关的韵律匹配数据,可以发现其相关系数也不太高,相关系数与显著性程度之间存在着一定的联系。通过进一步分析,我们发现,性别因素对于发音人之间的韵律匹配程度存在一定的影响,如在调域宽度匹配上,ZW1与ZM1和ZM2之间、ZW2与ZM2之间相关系数均不大,且都未表现出显著相关;又如在音量比匹配上,ZW1与ZM1和ZM2之间相关系数均不大,且都未表现出显著相关。

为了对语调音高、时长、音强进行同一语言社团内部的韵律匹配程度及离散程度考察,我们将4名发音人两两之间起伏度、停延率、音量比的相关系数分别进行平均求值和标准差求值,具体结果如表6所示:

表6  4名发音人两两之间起伏度、停延率和音量比相关系数情况


image

可以看出,对于说汉语的母语者来说,停延率的韵律匹配是最高的,起伏度次之,音量比的韵律匹配最低。另外,在标准差上也呈现相同的排列次序,停延率最小,起伏度次之,音量比最大。同一语言社团内部,语调三项参数的韵律匹配程度和离散程度是存在一定联系的,韵律匹配程度越高,聚集性就越强。

2.3  起伏度、停延率、音量比的关系

前面我们分别考察了汉语母语者不同发音人之间在语调音高、时长、音强三项参数的韵律匹配,那么,同一个发音人,这三项语调参数之间的韵律匹配又是如何呢?我们将4名发音人的语调三项参数两两之间分别做相关性分析,具体结果如表7所示:

表7  4名发音人起伏度、停延率和音量比两两之间相关系数情况


image

如表7所示,4位发音人停延率与语调调域宽度存在着强相关,相关系数均大于0.5,平均相关系数为0.67;四位发音人音量比与起伏度上线的相关度表现不一,其中男性的相关程度较高,女性的相关程度较低,不过四者的平均相关系数为0.59,超过了0.5;4位发音人停延率与音量比的相关程度除ZW1较低之外,其他三位的相关系数均大于0.5,为强相关。就此我们可以做一个简单的推断:作为母语者,其语调起伏度、停延率、音量比三者之间是存在着内在统一性的,具有较强的相关性,其中一项参数发生变化,其他的参数也会随之发生变化,存在较强程度的韵律匹配。

到底是音高跟时长的关系近,还是音高跟音强的关系近?我们从上表的相关系数可以大体得出这样的表现:音高跟音长相关而稳定;音高跟音强也是强相关,男性更强,女性稍弱;音长跟音强多是强相关,个别人较弱。吴宗济先生讲过:语音要加重,调值必升高;调值升高,语音不一定重。也就是音高跟音强之间是一种非可逆的关系。(石锋,2011)

对比平均值与标准差可以发现,停延率与语调调域的相关程度最高,标准差最小;音量比与起伏度上线相关程度和标准差居中;停延率与音量比相关程度最低,标准差最大。汉语母语者内部语调三项参数之间的韵律匹配程度和离散程度是存在一定联系的,韵律匹配程度越高,聚集性就越强。另外,4名发音人中,语调三项参数两两之间停延率与音量比的相关系数是最低的,音量比与起伏度的相关系数居中,停延率和起伏度的相关系数最高。可见,音量比的人际相关度是最低的,并且与其他两项参数的相关系数也不高,也就是说,汉语母语者语调音强的波动是最厉害的,彼此之间的差异也是较难控制的。