广西壮族自治区国家通用语言文字使用情况调查研究
上QQ阅读APP看书,第一时间看更新

第二章 西南官话、粤语、客家话、平话区域、普通话区域变体调查与分析

一 数据构成

此部分数据包括5个片区,分别为平话区、粤方言区、普通话区域变体、西南官话区、客家话方言区。各方言区样本情况如下:总共10335份问卷,各方言区问卷分别为2869份、2864份、543份、1090份、2969份,整理后形成的数据库暂且命名为“广西方言区国家通用语言文字使用情况及语言态度数据总库”(以下简称“方言区总库”)。

数据整体情况良好,采用分层抽样、PPS抽样等科学抽样方法,既保证了样本的随机性,又减少了抽样的误差;从样本容量看,剔除无效问卷后,有效问卷达10335份,样本容量很大;从调查对象看,把调查对象放在能反映语言变化的最敏感点——学校,中小学生多为就近求学,这样既能反映语言使用及态度的缓慢变化,又具有很强的区域性。同时,问卷中设置的问题涉及其父辈和祖辈,无须再对其父辈、祖辈进行专门调查就可以了解三代人的语言使用情况,节省了时间、人力、物力,更重要的是无形中扩大了调查的样本容量,从理论的角度计算,在家庭语言使用情况调查上,总体样本应扩大到实际调查人数的3倍;此外,为顾及城乡教育发展水平不同带来的语言使用及态度上的变化差距,调查的中小学校既有来自农村的也有来自城市区域的,避免整体结果出现偏高或偏低的情况。