第2章 心理测量和测验的一般介绍
2.1 复习笔记
一、测量的基本问题
(一)测量的定义
测量是按照一定的法则,用数字方法对事物的属性进行描写的过程。测量包括三个要素:测量的对象——事物的属性和特征;测量的规则或法则——给事物的属性分派数字的依据;测量的结果——描写事物属性的数字或符号。
1.测量的对象
测量的对象是事物的某种属性,而事物的属性大致可分为以下几类:
(1)具体型:其存在形式比较具体,大多可以被人的感觉器官所直接感觉到。如物体的长度、重量等。
(2)确定型:在一定的条件下,这些属性或特征是保持恒定不变的。例如,物体的长度和重量,只要物体的温度不变,受力状况不变,其长度也就相对不变。
(3)抽象型:它与具体型相对,其存在形式比较抽象,大多不能被人的感官直接感觉到。人的心理属性就大多属于抽象型,如学生的智力、个性等。
(4)随机型:即事物的属性是随机变化的。如人的记忆广度,尽管各种条件都保持恒定,但每次测量的结果还是会有所差异。
(5)模糊型:即事物的属性本身是模糊不清的。如某人热情奔放。
2.测量法则
法则是在测量时给事物属性分派数字的依据。任何测量程序仅是建立一个有序配对的集合,可用公式表示:f={(X,Y);X=任何事物,Y=一个数字}。当测量的其他条件相同时,使用不同的法则会产生不同的测量效果。法则的好坏,一方面取决于制定规则的程序;另一方面取决于所欲测量的事物属性本身是否易于建立规则及规则是否便于操作。
3.测量的结果
测量的结果指的是描述事物属性的数字或符号。它们在未被用来描述事物的属性之前,仅仅是一个符号,它们本身并没有量的意义。当数字被合理地用来描述事物的属性时,才赋予它以量的意义,即从数字变成了数。数对于测量的重要性是由数的功能决定的。数的系统有如下特征:①同一性和区分性;②等级性或位次性;③等距性;④可加性。
(二)测量的要素
任何测量都应该具备两个要素:参照点和单位。
1.参照点
(1)含义
要确定事物的量,必须有一个计算的起点,这个起点就称为参照点。参照点不统一,量数所代表的意义就不同,测量结果就无法进行比较。
(2)类型
①绝对零点:如测量轻重、长短等都以零点为参照点,这个零点的意义为“无”,表示什么都测不到。
②相对零点:是人定的参照点。如海拔高度,就是以海平面作为测量陆地高度的起点。不以绝对零点为参照点的计量只能进行加减运算,不能进行乘除运算。理想的参照点是绝对零点,但心理测量中很难找到绝对零点,多采用人为指定的相对零点。
2.单位
(1)含义
单位是测量的基本要求,没有单位就无法进行测量。没有单位,数量的多少、大小就无法表示。单位的种类、名称繁多,即使是测量同一事物,也可以用多种不同单位。
(2)理想的单位必须符合两个条件
①有确定的意义,即所有人对同一单位的理解意义要相同。
②有相等的价值,即相邻两个单位之间的差别总是相等的。
(三)四种测量水平和测量量表
量表是指把事物的属性表现在一个定有参照点和单位的连续体。史蒂文斯根据对测量结果数量化描述的不同水平,将测量分成四种不同水平:类别测量、等级测量、等距测量、比率测量。这四种不同水平的测量产生了相应的四种类型的量表,即类别量表、等级量表、等距量表和比率量表。
1.类别量表
类别量表又称名称量表。它根据事物的某一特点,对事物属性进行分类,并用数字或符号表示。它仅能区别不同类,如性别、年级等。在统计上,类别量表只能计算每个类别的次数(频数)。适用的统计方法属于次数统计,如计算百分比或列联相关,进行(卡方)检验等。
2.等级量表
等级量表又称顺序量表。它根据事物某一特点,将事物属性分成等级,用数字表示。这种测量水平,不仅能区分不同类别,而且能排出等级或顺序。等级量表反映事物的类别的差不必相同,不具有等距性。所适用的统计方法,除次数统计外,仅限于中位数、百分位数、等级相关系数、肯德尔和谐系数以及秩次变差分析等。
3.等距量表
它对事物属性的划分是等距的,单位是等值的,但没有绝对零点。它的参照点是人为指定的,只具有相对性质。因此,此类测量所得的数据可进行加减运算,但不能进行乘除运算,等距量表能更广泛地应用多种统计方法,如均数、变差、积距相关系数、T检验和F检验等。
4.等比量表
等比量表又称比率量表。它是一种理想的量表,也是最高水平的测量。它除具有等距量表的一切特性外,还具有绝对零点。对此种测量结果可以作加减乘除运算,除适合上述一切统计方法外,还可以使用几何平均数和相对差异量。
(四)直接测量和间接测量
根据测量时能否直接测到所欲测量的事物属性,可分为直接测量和间接测量两类。
1.直接测量
直接测量是一种能直接测得事物属性的测量,如测量事物的长度。
2.间接测量
间接测量是一种不能测得事物属性,只能根据测量结果去推测事物属性的测量。心理测量一般属于间接的测量。
(五)测量的方法
测量的方法有多种,如实验法、观察法、测验法。在心理测量中较多使用的是测验法。可以将包括实验、观察等方法在内的心理测量称之为广义的测量。而将应用测验法进行的心理测量称之为狭义的测量。
(六)测量的误差和精确程度
1.测量的误差和精确程度之间的关系
测量总是会有误差存在,测量的精确程度与误差大小有很大关系。误差越大,精确程度越低;误差越小,精确程度越高。
2.测量的精确程度的影响因素:①测量对象本身的属性;②测量所用的工具;③测量的目的。
二、心理测量的基本概念
(一)心理测量的定义
心理测量是指根据一定的法则,用数字对人的行为加以确定。即依据一定的心理学理论,使用一定的操作程序,给人的行为和心理属性确定出一种数量化的价值。
(二)心理测量的可能性
1.任何现象,只要客观存在,就总有数量性质。这个原则是美国心理学家桑代克在1918年提出的。
2.凡有数量的现象,都可以测量。这个原则是美国测验学者麦柯尔于1923年提出的。
(三)心理测量的特点
1.心理测量的间接性
心理测量是一种间接的测量。根据心理学特质理论,人们对测量结果进行推论,从而间接了解人的心理属性。
2.心理测量的相对性
对人的行为进行比较,没有绝对的标准,亦即没有绝对零点,它只是一个连续的行为序列。所有的心理测量都是看每个人处在这个序列的什么位置上,因此,位置具有相对性。
(四)心理测量的水平
心理测量只具有等级量表的特征。但由于多数心理特征具有常态分布的特征,且没有绝对零点,所以可以把测量后直接得到的原始分数转化为常态分布下的标准分数,把这些量表当作等距量表来处理。
三、心理测验的基本概念
(一)心理测验和心理测量的联系和区别
心理测验是了解人心理的工具,主要在“名词”意义上使用。而心理测量则是以测验为工具,达到了解人类心理的实践活动,它主要在“动词”意义上使用。因此,心理测量的意义范围更广一些,能被应用于实际心理测量的心理测验才是真正有效的测验工具。
(二)心理测验的定义
心理测验实质上是对行为样组的客观和标准化的测量。心理测验具有三个要素:行为样组、标准化和客观性。
(三)心理测验三要素
1.行为样组
行为样组是指心理测验中选择一部分测量人心理特性的有代表性的行为。因为心理测验测量的对象是人的心理特性,而测量心理特性又是凭借对其密切相关的行为间接测量的,在一个心理测验中,不可能把所有与该心理特性相关的行为全部测量到,而只能选择其中一部分行为进行测量。在编制测验时,必须慎重地选择有代表性的行为样组。
2.标准化
(1)含义
标准化是指测验的一致性,包括测验的编制、实施、记分以及测验分数解释的程序的一致性。这样才能保证在相同的条件下进行比较,比较的结果才有意义。标准化的范围包括:测验用品的一致性,测验指导语的同一性,测验中主试与被试关系的稳定性,测验评价的一致性等。所有能保证测验条件一致性的都是标准化应考虑的内容。标准化的另一重要步骤是建立常模。
3.客观性
(1)客观性是衡量科学性的一个根本标志。心理测验的客观性,是指测验不受主观支配,其测量方法是可以重复的,测验的实施、记分和解释都是客观的。行为样组的代表性和测验程序的标准化都是为了保证这种客观性。
(四)心理测验客观性指标
衡量心理测验客观性的指标包括以下几个:信度和效度,难度和鉴别力。
1.信度
(1)含义
信度是指测验结果的可靠程度。只有测验结果接近或等于实际真值或多次测量结果十分接近,才能认为测量结果是可靠的。
(2)信度的种类
①重测信度,是先运用某个测验实施首测,相隔一段时间后对它进行再测,然后计算首测与再测所得分数的相关。
②复本信度,是先运用同一测验的一型或A型施测,随后在最短的时间内运用二型或B型进行再测,然后再求它们得分的相关系数。
③内在一致性信度,常用的方法是将一个测验分裂为两个假定相等而独立的部分,然后计算这两部分的记分的相关系数(一般是以项目的奇数为一组,偶数为另一组),继而再用斯皮尔曼—布朗公式来估计整个测验的信度。
(3)信度系数
信度高低可用相关系数来表示,即用相关系数来估计两个随机变量一致性变化的程度。不同的测验内容,对相关系数的要求有所不同。一般标准智力测验应达到0.85以上,个性测验和兴趣测验一般应达0.70~0.80水平。学业成就测验要求信度在0.90以上,才能被称为是一个良好的测验。
2.效度
(1)含义
效度表示一个测验实际测量出所测特性或功能的真实性程度。它是指一个测验真正确实地测量到它所欲测量的东西的程度。效度是心理测验最重要的客观性指标,没有效度指标的测验是不能使用的。鉴别一个测验的好坏,其首要指标就是效度。
(2)效度的种类
①内容效度:表示测验所选的项目(测题)符合所欲测验内容的程度。确定内容效度的方法有两个:
a.逻辑法:即请有关专家对测验题进行考核,看测验是否能够测出所要测的内容;
b.经验法:即通过实践检查测验能否测出欲测的内容。
②结构效度:表示测验实际测量出所欲测量的心理结构或特征的程度。
③效标关联效度:又称实证效度或准则关联效度,它是测验分数与作为效标的另一独立测验结果之间的一致程度。在某些情况下,往往把准则关联效度也包含在结构效度内。
a.同时效度:指效标分数与测验分数是同时获得的。主要用来查明修订或自编测验的效度。
b.预测效度:指效标分数在测验之后相当时间获得的。主要用来评价测验的预测能力。
(3)考查智力测验效度的常用方法
①求测验结果与另一种已经标准化的测验结果的相关。
②求测验结果与学生学业成绩、教师评定之间的相关。
③观察每项测题通过人数的百分比,是否随年龄或年级的增长而增加。
④观察每项测题与全量表是否有连贯性。
3.难度与鉴别力
(1)项目的难度
项目难度是衡量测题难易水平的数量指标。估计项目难度的方法通常是以被试通过每个项目的百分比来决定的。如果某一项目通过百分比太高或太低,这说明该项目太易或太难。
(2)项目的鉴别力
项目的鉴别力是衡量测题对不同水平被试区分程度的指标。估计项目鉴别力的方法通常是以不同水平的被试通过每个项目的百分比之差来决定。项目的难度和鉴别力之间有一定的关系。一般中等难度的项目鉴别力最高。一个好的测验项目安排要客观,项目的选择也应客观。
四、测验的种类
(一)根据测量的对象分类
依据测验测量的事物的属性和特质的不同,测验可分为认知测验和人格测验两大类。
1.认知测验
认知测验又称为能力测验,这类测验主要包括智力测验、能力倾向测验(又称性向测验)、教育测验(又称成就测验)及创造力测验等。
(1)智力测验:目的在于测量受测者智力的高低。
(2)能力倾向测验:目的在于发现被试的潜在才能,深入了解其长处和发展倾向。包括一般能力倾向测验和特殊能力倾向测验。
(3)教育测验:又称成就测验,测量一个人(或团体)经教育训练或学习后对知识和技能的掌握程度。包括学科测验和综合测验。
2.人格测验
它测量的是个性中除能力以外的部分,即非能力测验。主要测量性格、情绪、需要、动机、兴趣、态度、焦虑、气质及自我概念等方面的个性心理特征及其相关行为。
(二)根据测验的人数分类
根据一次测验时测试人数的多少,测验又可分为个别测验和团体测验两种。
1.个别测验
(1)含义
个别测验是一名主试在一段时间内测量一名被试的测验。
(2)优点
①主试对被试的言语、情绪状态和行为反应有仔细的观察和控制的机会;
②有充分的机会与被试合作,激发被试测试的积极性;
③其结果比较正确可靠,适用于一些特殊对象,如幼儿和文盲。
(3)缺点
时间长,施测手续复杂,对主试要求高,主试需要经过严格训练,因而一般人不易掌握。所以个别测验仅在有特殊目的时才使用。
2.团体测验
(1)含义
在一段时间内一位主试同时测量许多人的测验。
(2)优点
①可以节省人力、物力和时间。
②主试也不必经过严格的专门训练,只要事先熟悉测题和指导语,在施测时能掌握测试时间并能控制测验现场即可。
③团体测验的记分和评分较个别测验更为严格和客观。一般每题都有标准答案。
④因为标准化样组规模相当大,故团体测验更易建立常模。
(3)缺点
由于同一时间内接受测量的被试多,不易有效地控制被试的行为,容易产生测量误差,从而影响测量的信度和效度。
(三)根据测验材料分类
根据测验材料或者测验内容的呈现方式来分类,主要分为语言或文字测验、非文字测验或操作测验两大类。
1.语言或文字测验
(1)含义
语言或文字测验的题目是以语言或文字呈现的,受试者也要用文字或语言作答。
(2)优点
它可以测量人类高层次的心理功能,其编制和实施也较容易,因而应用范围较广。团体测验多数采用文字测验形式。
(3)缺点
①语言或文字测验不能应用于语言有困难的人。
②对语言文化背景不同的被试加以比较时,也有明显的局限性。
③在同一文化背景下,被试文化程度和教育背景的不同,也会对测验结果产生影响。
2.非语言测验或操作性测验
(1)含义
此类测验题目不用文字来呈现,而是以图画(图形)、符号或实物(如方块、积木、仪器和工具等)为测验材料。被试的作答无需使用语言或文字,常以操作表达或回应。
(2)优点
①它不受文化因素的限制,因而可方便地用于学前儿童和不识字的成人。
②可进行不同文化背景的差异比较研究。
(3)缺点
费时,不易团体实施等。
(四)按测验的记分方式分类
按测验的记分方式可分为客观测验与非客观测验。
1.客观测验:指记分有明确的标准或有正确答案可资参照比较的测验。此种测验的记分能较好避免计分者的主观差异。
2.非客观测验:指计分无固定标准答案可资遵循的测验,它的评分会因评分者的宽严程度不同而有差异。
(五)其他分类标准
1.依据测验的命题形式来分,有选择反应测验及结构反应测验两种类型。
2.依据测验结果的解释模式来分,有常模参照测验和标准参照测验之别。
3.依据测验测查的程度又可分为筛选性测验和诊断性测验。
五、测验的应用
(一)了解个别差异
这是心理测验的最基本功能。个别差异是指一个人在成长过程中,因受遗传与环境的相互影响,在生理和心理特征上显示出的各不相同的特点。人的个别差异主要体现在认知、人格和社会背景这三方面。
(二)诊断、预测和评价
1.测验的诊断功能不只限于临床。在教育实践中,还可用测验来发现学生适应不良和学习困难的真实原因。了解这些不良适应和学习困难的原因,从而为采取适当的帮助和补救措施提供依据。
2.测验还有预测的功能。如能力测验可用来预测学生未来的成就。
3.测验结果可以用来评价一个人在能力和性格上的相对长处(强)和短处(弱),评价儿童已达到的发展阶段等。作为评价手段,测验既可用于个人,也可用于群体。
(三)甄选、分类和安置
“因材施教”和“人尽其才”是人才培养和使用的两个最主要原则。根据对“材”这样的特质进行测验而得到的结果,可在众多的候选人中确定最大可能成功者。以此选拔和培养人才,可大大节省财力和物力。也可将人的“材”加以分门别类,筛选出最适当的人员,安排至最适当的位置。智力测验和能力倾向测验可以作为职业指导的工具。测验在这方面的应用可提高职业指导的效率,有助于人事决策者作出更为准确的决策。
(四)为心理辅导和心理咨询服务
适当地利用标准化的测验与量表的量化结果资料,有助于当事人发现自己未知的潜能以及情绪困扰和人格障碍的问题所在,从而为其升学和择校、课程和职业选定等提供有价值的参考消息。这既有利于使心理辅导和心理咨询工作者的指导和帮助更有针对性,同时也使当事人的自我决策和行为矫正奠基于科学的根据之上。
(五)心理和教育科研的辅助手段
在心理和教育科研中,测验已经成为研究者搜集资料(也即量化的原始资料)的有力工具。人们常用测验对被试进行实验分组以达到等组化的要求;在进行科研成果的评定时也常常利用测验;由于心理测验在收集数据资料方面的功能,因此它在心理学和教育学基本理论的研究方面也发挥着重要的作用;它具有建立和检验假设的功能;不同教育措施的效果也可通过测验来比较和检验。