五 问卷调查
问卷调查(Questionnaire Survey),是指研究人员(或调查者)通过设计调查问卷,向被调查者获取相关信息的一种数据获取方法。在旅游研究中,问卷调查是应用最为广泛的一手数据收集方法。
在进行问卷调查时,需要注意两个极其重要的问题,一为问卷设计,二为样本选取。
(一)问卷设计
1.问卷设计过程
问卷中的一系列问题,不是靠主观意念凭空想象出来的,而是基于特定的研究主题,经过集思广益和广泛讨论之后精心设计出来的。研究主题是问卷设计的起点与归宿,问卷设计要以主题为依据,不能偏离主题,最终又要服务于主题。
对于任一个研究主题,都可以进一步细分为许多子主题,子主题又可进一步细分为一系列更小的具体题目,均需要收集一定的相关数据。许多具体题目的研究,可以通过文献、网站等方法取得数据;而有些具体题目的研究,则只能通过使用问卷调查的方法获取数据。这些需要调查数据支持的具体题目就被设计成一系列的具体问题,形成问卷初稿。为了保证问卷的质量,在正式调查之前,需要事先进行一次小范围的试验性调查,以检查问卷初稿中的问题,进一步完善问卷,最终形成问卷终稿。调查问卷的设计过程如图2—1所示。
图2—1 调查问卷的设计过程
2.问卷结构
问卷通常包括以下5个部分:
(1)标题。标题概括说明问卷调查的主题,应做到简明扼要,能够引起被调查者的兴趣。
(2)前言。前言一般包括自我介绍、调查目的、调查内容、填写说明、结果使用、保密承诺、感谢合作等方面的内容。
(3)个人信息。个人信息主要涉及被调查者的性别、年龄、文化程度、职业、地区、收入状况等方面的问题,相关数据常用于对被调查者的分类或分组。
(4)主体。此部分是问卷中最重要的,也是篇幅最大的一部分。在对旅游市场进行问卷调查时,一般会包括旅游动机(为什么?)、旅游行为特征(是什么?)、旅游活动评价(怎么样?)、旅游开发建议(怎么办?)等内容。
(5)结语。向被调查者再次致谢,并附上调查时间、调查地点、调查者姓名等相关的作业记录。
3.问题类型
从总体上讲,问题要表述礼貌,简单易懂,数目适量,类型多样,逻辑清晰。按照性质的不同,可将问题划分为开放式问题和封闭式问题两类。
开放式问题不提供具体的答案选项,允许被调查者不受限制地填写答案,常以填空题的形式出现,如表2—1第二行所示。此类问题灵活性较大,可能会获取调查者意料之外的、有价值的信息,但可能会遇到回答率低、不便于统计分析等问题。
封闭式问题将答案限定在一定范围之内,让被调查者从给定的答案选项中进行选择,不允许他们进行自由发挥,常以选择题的形式出现,如表2—1第三行所示。相对于开放式问题,封闭式问题易于回答、回答率高、便于进行统计分析,但可能会存在答案选项呆板、信息遗漏等问题。
表2—1 开放式问题与封闭式问题示例
封闭式问题的一个特殊形式是量表式问题,其答案选项是以量表(Scale)的形式呈现的。在旅游研究中,常用的量表为李克特量表(Likert Scale),主要用于旅游态度或评价的调查。该量表由一组陈述组成,每一陈述都有程度不同的5个答案选项(如“非常满意”“满意”“一般”“不满意”“非常不满意”),要求被调查者从中做出选择。在进行统计分析时,5个答案分别编码为1、2、3、4、5,可以进行量化分析。
例如,某酒店若要求客人对本酒店的服务项目进行评价,相关问题的答案选项即可以量表的形式呈现,如表2—2所示。
表2—2 关于酒店服务项目评价的李克特量表
4.问题措辞
对于问题的措辞,应遵循以下5个原则:
(1)避免使用专业术语。仅在面向行业专家进行调查时使用专业术语,其他情形尽量不要使用。
(2)概念表述清晰。如果概念含混不清,会让被调查者难以回答。
(3)使用非引导性问题。题目中如果使用一些暗示性的词汇,极有可能会对被调查者的回答产生某种诱导作用,从而不能做出客观的回答。
(4)一题一问。一个题目只关注一个具体的问题,而不能同时关注两个以上的问题,否则被调查者将无法作答。
(5)语言简洁明了。在题目意思表达明晰的前提下,语言表述能简即简,越简单越好。
表2—3的示例是5个存在问题的措辞以及改进之后的措辞。
表2—3 问题措辞示例
续表
5.答案选项
在设计封闭式问题的答案选项时,应遵循以下三个原则:
(1)穷尽原则。答案选项应涵盖所有可能出现的情形,不能有任何遗漏。如果选项过多,通常可先罗列主要选项,再将剩余选项一并归入“其他”项目中,如表2—4所示。
表2—4 穷尽原则示例
(2)互斥原则。各个选项的内容绝对不能重叠,否则有些调查者回答时将无所适从。表2—5中给出的是违背互斥原则的以及改进之后的答案选项。
表2—5 互斥原则示例
(3)单一尺度原则。各个选项应只有一个统一的度量尺度或衡量标准,否则会造成选项之间不具有可比性。表2—6所示是违背单一尺度原则的以及改进之后的答案选项。
表2—6 单一尺度原则示例
除上述原则外,为方便向统计软件中进行录入,答案选项的编号最好不要使用字母形式,而是采用数字形式,如表2—4至表2—6所示。
6.效度与信度
一份高质量的调查问卷,良好的信度和效度均需同时兼备。
信度(Validity),又称可靠性,是指使用同一问卷对同一(或相似)对象进行重复测量时所得结果的一致性程度。问卷的信度越高,说明其调查结果越稳定、越可靠,反之亦然。假设要开展游客在某一地区旅游体验满意度的问卷调查,如果问卷在多次随机抽样中所得到的结果变化不大,便可以认为此问卷是比较有信度的。在研究过程中,研究人员可以通过设计相似题目、增删题目、试测、重复测量等方式来保证问卷的信度。
效度(Reliability),又称有效性,是问卷能够准确测量研究对象特性的程度,或问卷能够准确反映研究主题的程度。问卷的效度越高,其调查结果与研究内容的契合度就越高,反之亦然。在上述游客旅游体验满意度调查中,如果问卷中只有游客对于景区满意度的题目,而缺少关于住宿、餐饮、娱乐等方面的相关问题,那么这份问卷便是低效度的,因为问卷的题目并没有准确反映或完全涵盖旅游体验满意度这一主题。在研究过程中,研究人员需要对研究主题的相关概念进行准确把握,在此基础上,可通过强化问卷的设计程序或采取专家建议等方式来保证问卷的效度。
钟栎娜(2010)在《旅游学刊》上发表了一篇题为《旅游研究的信度与效度》的论文,系统地介绍了信度和效度在旅游研究中的意义、信度的测量和确保信度的一般技术、效度的测量和确保效度的一般技术三方面内容,对于旅游研究中的问卷设计具有重要的指导意义。
(二)样本选取
由于成本条件的限制,问卷调查往往是针对具体的样本进行的。在统计学中,从总体中选取一个代表性样本的过程,称为抽样(Sampling)。由于抽样而导致的样本统计值(样本统计量的值)与总体参数值之间的差异,称为抽样误差(Sampling Error)。
假设总体由某大学的5万名学生构成,人均月花费(总体参数值1)为1000元,男女比例(总体参数值2)为4∶6。假若要从中抽取一个由500名学生构成的样本,以考察不同性别学生的旅游行为差异。对于一个最理想的、最具代表性的样本,其人均月花费(样本统计值1)、男女比例(样本统计值2)应与总体参数值完全一致,即1000元、4∶6。但在实际抽样中,这种样本基本上属于不可能完成的任务,样本统计值与总体参数值之间不可避免地存在着或多或少的误差。误差反映了样本对总体的代表程度,其值越小,说明样本越具代表性。要减少误差,选择合适的抽样方法极为关键,以下4种方法在问卷调查中较为常用。下面就以对大学生进行抽样的例子进行介绍。
1.简单随机抽样
简单随机抽样(Simple Random Sampling)是指从容量(指个体的个数)为N个单位的总体中任意抽取容量为n个单位的样本时,使每个个体被抽中的可能性均相等的一种抽样方式。最初,研究人员常使用一种叫作随机数表(Random Number Table)的工具来进行简单随机抽样。随机数表是由0到9十个数字所组成的表格,每个数字在表中出现的次数是相同的,在表中出现的顺序是随机的,如表2—7所示。
表2—7 随机数表(部分)
续表
使用随机数表进行抽样时,需要三个步骤:
首先,对总体中的所有个体进行编号。在本例中,需要对5万名学生进行编号,如从00001号到50000号。
其次,根据编号情况确定随机数的位数。本例中的编号为5位数,故随机数也应为5位数。
最后,在随机数表中,从任意一个数字开始,按行或按列依次抽取随机数,编号与这些随机数相同的个体即被选中。若遇到随机数重复出现或超过编号范围的情形,可将其忽略,直至达到样本容量的要求。本例中,可从第一行第一列的第1个数字8开始选择5位数的随机数。第1位随机数为81628,因超出编号范围而被忽略;第2位随机数为36100,相应编号的学生即被选中;之后继续按以上程序进行抽取。(利用上述步骤进行抽样时,过程相当烦琐,工作量很大,而借助于SPSS统计分析软件,自动生成随机数,可大大地提高工作效率,相关的内容将在第三章介绍。)
使用随机数表进行简单随机抽样时,针对的是容量已知的总体,这类总体被称为有限总体。而对于容量未知的无限总体,因个体无法进行编号,故随机数表不再适用。在此情况下进行简单随机抽样时,需要设计专门的抽样规则,以尽可能地保证每个个体被抽中的可能性相同。
例如,对某处景区的游客进行现场调查时,对当天的游客数量是无法确定的,这时可以先随机抽取一名游客作为第一个个体,然后采取每隔一段时间(如10分钟)或每隔几名游客(如20名游客)的方式进行抽样,该方法类似于下述的系统抽样。
2.系统抽样
系统抽样(Systematic Sampling),又称等距抽样,是根据相等的间隔或距离进行个体抽取的一种随机抽样方式。与利用随机数表相比,该方式较为简便易行,效率较高,且能保证同样的样本质量。在进行系统抽样时,需要以下4个步骤:
首先,对总体中的所有个体进行编号,并按大小顺序排列。如对大学生进行抽样的例子中,需要对5万名学生编号并排序,如从00001至50000号依次排列。
其次,根据样本容量确定组数和间隔距离。本例中,样本的容量要求为500名学生,故将总体分为500组;将总体容量5万和样本容量相除,即得到间隔距离为100。
再次,从第一组中随机抽取一个个体,作为抽样的起点。本例中,可从第一组(前100名学生)中,随机抽取一名学生作为样本的第一个个体。
最后,从起点开始,依次以固定的间隔进行抽取。本例中,从抽取的第一名学生开始,每隔100名学生、在剩余的499个小组中依次进行抽取,每个小组抽一名学生,共计500名。
3.分层抽样
分层抽样(Stratified Sampling),又称类型抽样,是先将总体的所有个体按其属性特征分成若干层(或类别),然后在各层内进行简单随机抽样或系统抽样的一种随机抽样方式。通过对总体进行划类分层,增强了层内个体之间的同质性或相似性,从而会使抽取的样本更具代表性。
本例中,可先按性别将5万名学生分成男、女两个类别,分别有2万名和3万名学生。然后根据样本容量(500名学生)和男女比例(4∶6),在两类中分配具体数量,分别为200名男生和300名女生。最后,使用简单随机抽样或系统抽样方式,分别从两类中进行抽取。
4.整群抽样
整群抽样(Cluster Sampling),又称聚类抽样,是先以一定的标准将总体的所有个体划分为成若干个互不交叉、互不重复的群(或集合),然后从中随机选取几个群组成样本的一种随机抽样方式。
本例中,若此大学拥有100个专业,可先根据专业将5万名学生划为100个群,再从群中随机选取几个专业的学生构成样本。
与前三种抽样方式相比,整群抽样是以群为单位,而不是以个体为单位进行抽样,其效率更高,但是样本的代表性可能较弱。而且,在本例中,整群抽样还不能保证所得到的样本容量就是500名学生。
因此,在实际操作中,可采取分级整群抽样(Multi-stage Cluster Sampling)的方式,即先利用整群抽样随机抽取几个群,然后在各群内再使用简单随机抽样、系统抽样或分层抽样方式进行抽样。
本例中,可先使用整群抽样方法抽取若干个专业,再根据各专业的学生总数和样本容量要求,确定相应的分配比例和数量;然后在每个专业内部,选择其他三种抽样方法中的任意一种进行随机抽样。