第五节 量表的编制
一、测验的目标分析
(一)测验对象
测验对象,即测验测量的是哪些个人或团体。通常以年龄、性别、职业、受教育程度、社会经济、文化背景等来区分。施测于不同对象的测验有各自不同的特征。
(二)测验用途
心理测量用途,即编制的测验是干什么用的,是用于描述受测者的心理特质,还是用于诊断,抑或是选拔和预测。显示性测验是指测验题目和所要测量的心理特征相似的测验,分为样本测验和标记测验;预测一些没有被测量的行为的测验。
(三)测验目标
测验目标是指编制的目标是用来测什么的,即用来测什么样的心理变量或心理特征。
(四)目标分析
1.工作分析
对于选拔和预测功用的预测性测验,它的主要任务就是要对所预测的行为活动作具体的分析,称之为任务分析或工作分析。包括两个步骤:第一是确定哪些心理特征和行为可能使要预测的活动达到成功;第二是建立衡量被试是否成功的标准,这个标准我们称之为效标。
2.对特定概念下定义
如果测验是为了测量某种特殊的心理品质或特点,那么测验编制者就必须给所要测量的心理或行为特质下定义,然后必须发现该特质会通过什么行为表现出来或怎样进行测量。
3.确定测验的具体内容
就是将概念转化为操作定义,被测的目标特质由哪些维度组成,这些维度又由哪些行为表现表达,各种维度的权重如何分配等,从而确定测验的具体内容。
二、测验题目的编写
(一)收集测验资料
测验资料要丰富,要有普遍性,要有趣味性,且避免直接翻译国外的测验题。收集资料的来源有以下几种:已出版的标准测验;理论和专家的经验;临床观察和记录;其他关于人格、智力等描述的资料。
(二)选择项目形式
项目形式应该使受测者容易明了测验方法,使受测者在完成测验时不会因测验项目的形式不当而做错,测验经济,省时省力。
(三)编写测验项目
编写测验项目时要注意:第一,测验项目的取样应当对预测心理品质具有代表性。第二,测验项目的取材范围要同编制计划所列项目范围相一致。第三,测验项目的难度应有一定的分布范围。第四,编写测验项目的用语要力求简单明了。第五,初编题目的数目要多于最终所需要的数量,以便筛选或复制复本。第六,测验项目的说明必须简明。
(四)命题的一般原则
1.内容方面
内容符合测验的目的;内容取样要有代表性;题目间内容相互独立;避免贪多而乱出题目。
2.文字方面
使用当代语言;语句要简明扼要;最好一句话一个概念;排除与答案无关的因素。
3.理解方面
题目要有确切答案;题目的内容不超出受测团体的知识水平和理解能力;题目格式不要被人误解;除创造力测验与人格测验外,不应具有引起争议的可能。
4.社会敏感性方面
尽量避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。
(五)测题的种类及编制
根据受测者的应答方式不同,有固定应答型题目和自由应答型题目。固定应答型题目,即客观题,包括:是非题、选择题、匹配题等。自由应答型题目,即主观题,包括:填充题、简答题、应用题、论文题、联想题、操作题等。
1.是非题
提供许多陈述句或疑问句,要求被试在两种可能的回答中选择一个。判断题命题容易,评分简单省时,被试回答方便,一般在教育测验中使用较为广泛。其缺点在于这种格式只适用于考察被试对简单观念或知识的了解,从而会鼓励被试去记忆无关知识,而忽略重要部分。此外,被试容易猜测作答,分数受机遇的影响较大,可靠性自然也差。
2.选择题
包括两个部分:题干和选项,被试从多个选项中选择一项自认为正确的答案作答。测题难度取决于所考核知识点本身及错误答案的迷惑性程度。选择题的优点在于使用范围广,既适用于文字和数字的材料,也适用于图形材料;不仅评分简单、省时、客观,而且相比是非题,它更少受猜测的影响。缺点是编拟迷惑答案比较困难,尤其是编拟高难度选项时更难;选择题无法测量出被试的言语表达能力和概括组织能力;猜测影响仍不能完全排除。
3.匹配题
适用于测量概念与事实之间的关系。测题结构上包含两个部分,一个部分为一组刺激项目,另一个为一组反应项目,通常是在后者中选出与前者相适合的项目。匹配法除了具有选择法的优点以外,它的测题还可以同时考核较多有相互关联的材料,因此覆盖面较广,编拟起来也相对容易。但它对选项的同质性要求较高,有时为了力求同质,会将一些不太相干或不太重要的内容也编拟进去。
4.简答题
要求被试用一个正确的短语、句子或较为简单的一段文字来完成测题。编制简答题时宜用问句形式,如果使用未完成的句子,则空格尽量放在最后。如果是填充形式,空格不宜太多,过多空格会使题意不明确,并且所空出的应该是关键词句。每题应只有一个正确答案,而且答案要简短而具体,对不完整的答案,应事先规定评分标准。简答题的优点:它的编写相对比较简单、灵活,不易受猜测的影响;可以测量各种层次的知识和能力,应用较为广泛;在各类题型中是最易于编制的一种,不用考虑选项之间的同质性问题。简答题的缺点是不能测量复杂的知识和能力,评分也不够客观且费时。
5.操作题
操作题是介于一般认知结果的纸笔测验和在未来真实情境的实际活动之间的测验,让被试实际操作,如画图、走迷津、拼配物体等,可作为纸笔测验题的补充。编制操作测验的四条原则:第一,明确所要测量的目标,并将其可操作化。第二,尽量选择真实性较高的项目。第三,指导语要简明扼要,并有具体的要求。第四,制定评分标准,确定计分方法。
三、测验的编排
(一)合成测验
合成测验要完成测试项目的选择、编排,以及复本的编制。测验项目的选择要考虑测验的性质、项目的难度和区分度三个因素。常见的测验项目排列方式有并列直进式和混合螺旋式。测验项目的编排一般要由易到难,这样可以避免受测者在难题上耽误时间,影响后面项目的解答。在测验最后可有少数难度较大的题目,以测出受测者的最高水平。
(二)预测与项目分析
预测时要注意,预测对象要有代表性,应取自将来正式测验准备应用的群体,预测情境要力求与正式施测一致,预测时间可以适当延长,保证受测者完成测验,应该对预测中受测者的反应给予记录。
项目分析就是对预测结果的统计分析,对项目的分析包括质的分析和量的分析两个方面。前者是从内容取样的适切性、题目的思想性以及表达是否清楚等方面加以评鉴,后者是对预测结果进行统计分析,确定题目的难度、区分度、备选答案的合适度等。
(三)信度和效度考察
信度和效度是评价测验的核心指标,直接影响测验的品质,为选择测验提供了科学依据,也是结果解读的重要参照依据。
(四)常模制定
测验分数必须与某种参照系统比较,方能显出它所代表的意义。多数心理测验是把个人所得的分数与代表一般人同类行为的分数相比较,以判别其所得分数在团体中所处相对位置的高低。此处的“代表一般人同类行为的分数”即为常模,是整个人群的分布状况。
(五)编写指导手册
编写指导手册说明,是为了告诉使用者如何使用该测验,测验指导手册的内容如下:
1.测验的目的和功用。
2.测验编制的理论背景以及选择项目的依据。许多手册还提供选择题目的统计指标。
3.如何实施测验的说明,包括实施方法、施测时限、注意事项等。
4.测验的标准答案和记分标准。
5.常模资料,包括常模表、常模适用的团体及对测验分数如何作解释。
6.测验的基本特征,包括难度、鉴别力、信度、效度和因素分析的资料,以及这些资料取得的条件和情境。
四、测验的标准化
测验的标准化是指测验的编制、实施、评分以及分数解释都有统一的标准,以减少无关因素对测验的影响。标准化测验具有较高的质量。它的效度、信度都较高,增加了测验的客观性,所得的结果较为真实。没有标准化,测量仅是一种非正式的过程,它随施测者的不同而变化。具体来说,测验的标准化应该包括:
(一)测验内容的标准化
测验内容的标准化,即所有受测者施测相同的或等值的题目。内容标准化有两层含义:其一,测验题目必须能测量所要测的目标,题目内容应是总体的代表性取样;其二,对所有的被试必须实施相同的或等值的测验。即给所有被试实施相同内容的刺激(处理),这样对被试的行为或反应才能进行比较。另外要使测量的物理特性保持一致,这就要求在编制测验时,测题的印刷和成批生产的器具能保证物理特性上的一致,而使测验条件保持一致,使测验结果更可靠。
(二)施测过程标准化
施测过程标准化,即受测者在相同的测验情境下,接受相同的指导语,在规定的相同测验时限内完成测验。只有对所有的被试都使用相同的测题,并且是在相同的条件下进行测验,他们的分数才能进行比较。标准实施主要包括:
第一,统一的施测情境。例如同一场所布置,统一的桌椅高度,统一的采光条件等。
第二,统一的指导语。指导语有两个方面,一种是对被试的,另一种是对主试的。对被试的指导语应尽量做到清晰,简明扼要地向被试解释如何对测题做出反应,如果测题的格式对于被试是生疏的,应举出一个例题。例如一个思考能力测验给出这样的指导语:“以下这些测验的目的是考考你认为最合适的,如不知道,可以猜测,猜测的影响在评分中已考虑了。”
第三,统一的施测时间。测验的时限是测验程序中的一个重要方面。一般说来,每一测验都要求被试在一定的时间内完成。大多数人格测验在实施时不受时间限制,但速度测验的目的是测量作业的快慢,所以测验的时间要求相当严格,一般在测验时限内,作业最快的被试也不能把测验全部做完。施测时要注意按指导语要求准确计时。难度测验在理论上不应有时间的限制,但在实际上为避免个别被试过分拖延测验时间,仍有一定的时间限制,但一般足以使90%以上的被试能在规定时间内做完全部测验。
(三)测验评分的标准化
测验评分的标准化,即两个或两个以上评分者对同一份测验试卷的评定是一致的;不同评分者之间取得完全的一致似乎是最理想的,但实际上对主观题即论文式的测题评分时,很难完全一致。一般认为在成对的受过训练的评分者之间平均一致性达到90%以上,就认为评分是客观的。只有保证评分是客观的,才能把分数的差异归于被试的差异。
标准化的评分可归纳为三个要点:第一,对反应要及时和清楚地记录。第二,应用标准反应表即记分键作为对照加以评分。对于采用选择法的测题来说,标准反应表包括每一道题答案的号码或数目;对于论文式测题来说,它包括一系列正确答案与容许变化的范围;对于作文式格式的测题来说,它规定着作为具有某种特征或特点的指示的反应。第三,将被试的反应与标准反应表进行比较。这在选择格式的测验上较为明确便利;但对于一些主观题,评分时要根据记分规则所详细规定的要求来比较被试的作业。一些好的测验如C-WISC的说明书就提供了评分规则的很好的范例。
(四)测验分数解释的标准化
测验分数解释的标准化,即对于同一测验结果给出相同的解释。从某个测验中得出的单个分数往往并不能说明什么问题,只有把这个分数与常模进行比较,才能对测验分数进行很好的解释。
建立常模以对测验分数进行客观、公正的解释是标准化的又一个重要步骤。常模是指某一标准化样组在某一测验上的平均分数。它的功用在于给测验分数提供比较的标准,从而对测验分数加以解释。为了建立测验的常模,测验编制者应在标准化的条件下,对具有代表性的大规模样组施行测验。样组的代表性可以通过随机抽样或随机分层抽样和采用大规模样组来达到。这样得到的测验组的平均成绩可作为常模,给分数解释提供参考。根据常模,并结合该测验信度、效度的资料,就能对测验所得的分数作较为合理、妥帖的解释,也使测验整个过程更具客观性。
测验标准化只是使测验程序达到统一,在使用时还应注意每一测验都有它的使用条件和范围,只能在一定情况下使用,否则会造成不良后果。这也是心理工作者应用心理测验时必须加以注意的,即如何选择适当的测验,使之对于个体来说是最适用的。