上QQ阅读APP看书,第一时间看更新
第二节 语言评估的常用方法
一、观察法
观察法就是在一段时间内,在现实情境中有目的、有计划地考察和描述儿童语言沟通行为的方法。主要用于对某些特定的语言行为是否发生,以及发生的频率、背景或与之相关的因素等方面的取样。观察法往往能收集到观察对象在日常生活中真实、典型的行为表现,且无需将儿童的表现与参照标准作对比,只需要客观描述其在特定方面的表现。因此,可以用于一些不适合用测验法或其他方法进行语言评估的儿童。
儿童语言能力评估所采用的观察法通常为自然状态下的观察。即可以是评估者在诊疗室中的直接的参与观察,也可以通过影音设备,如录音机、录像机对儿童生活环境中的沟通行为进行间接的非参与观察,因此,在语言评估中,观察法常常与语言样本分析法联合使用。
观察法中最重要的是要界定所要观察的行为,可以通过对家长的访谈或是前期的测验来确定行为观察的目标,制订观察方案。观察方案包括观察清单或评定表格,一般由评估人员根据实际需要进行设计,以便检查和计数特定的行为。所要观察的行为必须是外显的、可观察和可测量的,能够对行为的出现频率、持续时间、强度或其他维度给出数量化的评定,在评定时要注意使用与设计目标相符的记录系统,常用3点或5点计分的方法。表3-2-1是一个检查怀疑有语言障碍的儿童交流能力的行为观察表的样例,采用的是3点计分法。
行为观察适合于那些缺少常模数据的行为,因此评估往往带有某种程度的主观性。例如,如果想了解一个儿童用口语或非口语的方式对问题给出不当的反应的频率是多少时,就可以在自然情境下问儿童一些问题,然后计算恰当回答和不恰当回答的数量。这些观察结果可以作为基线期的数据,用于评估干预效果。
表3-2-1 交流技能观察分析表
行为观察还可提供以下3个方面的信息:①儿童是如何处理任务的,其错误的模式和自我监控能力如何;②在进行干预后,儿童行为的改变程度如何;③能够促使儿童改变的最具可能的干预风格及方法是什么。
二、访谈法
通过对儿童有深入了解的家长、教师及其他成人进行访谈,也能收集到一些儿童健康方面的有效信息,作为对直接临床评估的补充。按照有无结构来分,访谈可以分为非结构性访谈、结构性访谈以及半结构性访谈。非结构性访谈是指访谈人员只按照一个粗线条的访谈提纲进行的非正式、非标准化的访谈,这种访谈法对具体的提问方式、提问顺序、回答方式、记录方式等没有统一的要求,访谈人员可以根据具体情况对这些内容作灵活调整。结构性访谈是根据统一的设计要求,通过结构化的问题进行的标准访谈。通常要求访谈者按照一定的顺序提问,对如何回答问题和记录方式也有统一的要求。半结构性访谈则往往兼具非结构性访谈和结构性访谈的特点。
临床工作人员在编制访谈提纲或是访谈问卷时应注意以下几个方面的问题:①一个问题只能聚焦在儿童语言发展的某一个具体的方面,不要同时涉及若干个不同的方面;②不要在提问时流露出自己的偏见或是价值导向;③问题表达要清晰明确,通俗易懂,尽量避免使用专业术语,必要时可以制订统一的指导语,说明对问题回答的范围、内容以及回答方式等;④问题排列上,访谈开始时可以提一些简单、易于回答的问题,敏感或涉及隐私的问题一般放在最后即访谈结束之前提出,以免因这些问题引起访谈对象的消极情绪反应。
目前,国外已发展出一些与标准化测验一样具有信度、效度等心理测量学指标的访谈问卷,如语言发展调查问卷(language development survey)、社会沟通问卷(social communication questionnaire)等。这些访谈问卷能够使我们能在有限的时间内掌握更多关于儿童基线期功能水平的详细情况。
在儿童语言评估中,有时也会将观察法和访谈法联合使用,如发展量表。发展量表是具有某一特定发展阶段的样本典型行为的访谈或观察工具。通常情况下,这些工具没有提供常模分数,因此不适用于在初期判断儿童是否具有明显交流缺陷。但是,一旦确定儿童存在某些方面的语言障碍,发展量表可以帮助进一步了解在某一方面该儿童所具备的基线功能的年龄等价水平。常用的发展量表如语言行为里程碑评估及安置程序(VB-MAPP)、Gesell发育量表等。
三、测验法
儿童语言能力测验通常包括标准化测验和目标参照测验2种。
(一)标准化测验
标准化测验也称常模参照测验,是语言能力评估中最主要的正式评估方式,是一种脱离语境的测验形式。用设计出来的一套题目给一群语言发展正常的儿童施测,分年龄组计算出可接受范围的变异的得分即为常模。以常模为参照标准编制的测验即为常模参照测验。标准化测验的优点在于可以将儿童个体的行为与同年龄正常儿童群体进行比较,因此标准化语言能力测验是目前鉴别儿童的语言发展是正常的最重要的依据。标准化测验必须具备以下一些心理测量学指标。
1.信度
信度是测量结果的稳定程度。如果一个测验多次的测量值一致程度较高,或者说接近真值,我们认为这个工具具有较高的信度,是可靠的。
2.效度
效度是指一个测验是否测得了它想要测得的能力。
3.集中程度及离散程度
在测量样本足够大的情况下,标准化测验中儿童语言能力常模得分应该呈正态分布。平均分就表示测量的集中趋势,多数人的得分会在算数平均数上下波动。标准差说明一个得分落在了距离平均数多远的地方,表示被试得分的离散程度。
4.诊断准确性
诊断准确性是测验能够准确区分当事人诊断类型的程度。测量工具中最常用的诊断准确性的指标是特异度和敏感度。特异度是指测验正确诊断为无病的人数占实际无病人数的百分比;灵敏度是指测验正确诊断为有病的人数占实际有病的人数的百分比。特异度和灵敏感度越高说明测验诊断准确性越高。
5.测量标准误
一个建构良好的测验通常会报告测验标准误。标准误使我们可以根据观测值来确定置信区间,用置信区间估计真值。公式如下:
真值的置信区间=观测值±标准误
标准误和置信区间说明当事人的测试分数代表的是一个范围,而非一个点。对于跨时间的得分比较(如康复训练前和康复训练后的测验分数比较)也具有重要意义。
6.导出分数
标准化测验中,测验所得到的原始分通常不能用于解释被试的情况,只有将被试的原始分与标准样本中其他被试的得分相比较,即转换成导出分数,测验得分才有意义。常用的导出分数有:标准分、百分等级、当量分数等。
(1)标准分:
是以标准差为单位度量原始分数距离该群体平均分数多少个标准差的一种量数。标准分数的主要优点在于范围内的得分具有同等的单位,即具有等距性的特点。常用的标准分数有Z分数、T分数以及离差智商。
(2)百分等级:
百分等级说明在常模群体中得分低于某一被试得分的人数比例。一个得分为第10个百分等级的当事人说明只有10%的常模人数低于其得分。百分等级不是等距量表,不能像标准分数一样假设其等级之间的距离是相等的。
(3)当量分数:
当量分数(equivalent scores)是按照年龄(年龄当量)、年级(年级当量)等一定的水平将原始分进行分级。当量分数代表原始分所对应的特定年龄或年级组常模的中间值。如一个7岁儿童在PPVT-Ⅳ上原始分为55分,其年龄当量为4岁。即该儿童的得分相当于4岁儿童PPVT-Ⅳ常模得分的中间值。当量分数不适合用于确定儿童发展是否有显著缺陷,而是用于向家长和老师解释语言存在明显障碍的儿童的语言能力的发展情况。
(二)目标参照测验
目标参照测验主要关注个体在所测量内容上表现出的绝对水平,而不是个体间水平的差异。目标参照测验既可以用于非语境情况下的正式评估,也可以用于语境情况下的非正式评估。相比于标准参照测验,目标参照测验更适合考查儿童在语境化情况下的语言表现。
1.语言理解目标参照测验
语言理解目标参照测验的评估难点在于避免猜测和无关因素的干扰,因此,评估者在编制和应用语言理解用目标参照测验时应注意以下几个方面:
(1)避免过度提示:
不要提供过多的线索,避免让儿童根据常识进行猜测。例如“把勺子放进碗里”是儿童在日常生活中常会遇到的情境,因此这样的指令更容易被儿童猜测,而“把勺子放进口袋里”与儿童的生活经验相去甚远,因此这样的指令也更难以被猜测。
(2)选择合适的语言刺激:
在进行语言理解测验时,要明确测验的目标词,除目标词外,其他词汇应当都是儿童熟悉的词汇。例如,对于多数3岁儿童而言,当目标词为“红色”时,用“把红色的苹果给我”要比用“把红色的樱桃给我”更合适,因为如果用“把红色的樱桃给我”作为测试句儿童没有做出反应,可能是由于儿童不熟悉“樱桃”一词的含义所致。
(3)明确正确的反应方式:
语言理解目标参照测验可以使用自然反应或结构化反应。自然反应包括行为依从和问题回答。行为依从适用于观察低龄的儿童,包括触摸、移动、拿起、指出或是给出物品以及完成某些动作等。儿童语言发展水平达到24个月时,才能够采用问题回答的反应方式。通常儿童在语义完全正确之前会出现语法正确而语义错误的现象。因此,对儿童的回答可以从语义和语法两方面计分。语法准确性仅考察回答类型是否恰当。例如,问一个儿童苹果是什么颜色,如果他回答“蓝色”,可以说在语法上是正确的,但在语义上是错误的。
结构化反应包括指图、物品操作、最适反应等。最常见的结构化反应方式是指图片,发展水平在24个月以上的儿童一般可以完成指图任务。物品操作即给儿童呈现一套物品,要求儿童完成指定的操作任务。发展水平在20个月左右的儿童一般可以采用这种反应方式。指图和物品操作都可用于评估儿童的词语理解和句子理解能力。最佳选择或判断反应(best-fit or judgment response)主要用于测试一些元语言能力,即要求儿童对语言进行评价而不仅是应用语言。该方法适合评价发展水平在5岁以上的儿童。例如,要求儿童判断“小明把椅子推倒了”和“椅子把小明推倒了”这两句话中哪一句是正确的,哪一句是错误的。这种反应方式还可以用于对话、推断、说话意图等方面理解的评估。
(4)反应次数要足够多:
无论采用哪种反应方式,都需要有足够的反应次数,即对应的题项数量要够多,才能降低猜测反应的影响,得到更准确的结果。在使用目标参照测验时,通常要求每个测试内容应包括4个以上的条目,且要求儿童至少做对3个才算通过。
2.语言产生目标参照测验
语言产生目标参照测验的评估难点在于获得反映儿童语言表达能力的代表性样本。常用于语言产生目标参照测验的方法有引发模仿、引发产生和结构分析3种。
(1)引发模仿:
要求儿童“跟我说一样的”是引发语言产生的最简单方式。但在实际生活中,儿童很少通过重复别人的话来学习语言,因此引发模仿通常是语言产生评估中最后使用的方式。
(2)引发产生:
通过设置情境,引发儿童产生特定的语言。主要有模式引发、角色扮演、游戏引发以及叙述引发4种方式。
1)模式引发:
向儿童示范一组模式相似的语言,然后要求儿童产生新的类似的语言,例如“我用勺子吃饭,用刀切菜,用笔写字”。
2)角色扮演:
要求儿童扮演一定的角色,如让儿童扮演布娃娃的妈妈,让她问“布娃娃是不是饿了,要不要吃东西?”从而评估儿童产生疑问句的能力。
3)游戏引发:
通过游戏引发儿童语言产生,例如,评估人员示范游戏形式,描述图中的一个元素,如让儿童“找一找戴红色帽子的男孩”,然后进行轮流游戏,看儿童能否产生类似的句子。
4)叙述引发:
是评估儿童产生连续讲述能力的一种较为有效的方法。给儿童图画书并给他讲一个简单的故事,然后要求其进行再述。也可以给儿童一些故事图片材料,让儿童根据图片建构故事。
(3)结构分析:
结构分析是借助语言样本分析法了解儿童自发交流语言样本的特征,找出其结构、形式、功能以及什么情境影响了这些沟通的使用。具体操作见下文语言样本分析法。结构分析的任务是考察儿童语言样本中是否存在评估者认为应该出现但未出现过的语言结构和功能,然后评估者可以尝试通过诱导让儿童产生这些语言结构或功能,如果诱导仍不成功,就试着让儿童直接模仿。
总之,目标参照测验的优势在于其灵活性比较大,必要时可以将几种方法联合起来使用以得到更多的语言信息。
四、语言样本分析法
语言样本分析是先将儿童口语述说的语料一字不漏地转写成文本,再通过量化或性质分析儿童的语言能力。语言样本分析可以很好地反映儿童所表现出来的语言形式、语言内容、语言运用、说话速度、序列组织等方面的能力,并且是唯一可以了解自然情境下儿童语用技能的方法。该方法是对标准化测验的重要补充。
1.语言样本的收集
语言样本应一般包括50~100句话语,如果能达到200句以上的语言样本则更能体现语料的代表性。收集语言样本时,最好能够通过录音或是录像的方式将语言样本记录下来。
(1)语言样本收集的注意事项:
为获取真实可靠的语言样本,评估人员应注意以下几点:①收集语言样本前应与儿童建立良好的合作关系;②尽可能减少无关的干扰;③在采集样本时尽可能等待儿童说话,评估人员不需要用说话填充沉默的时间;④在通过活动来获得儿童语言样本时,尽量挑选儿童感兴趣的主题或材料,且能够根据不同的儿童改变评估主题和材料;⑤要收集主题内容多样的语言样本;⑥收集不同环境背景下儿童的语言样本(如治疗室、游乐场、家、学校或幼儿园等);⑦收集不同诱导方式下产生的语言样本(如会话、叙事、对图片的回应);⑧如果评估人员无法收集某些场合的语言样本,可以要求其他人(如父母或教师等)协助收集;⑨在收集过程中,尽量避免使用是否问题以及其他会引发儿童作出简短回答的问题,必要时可以限定主题或回应方式,如“请给我介绍一下你在幼儿园里最要好的3个朋友,说一说你为什么喜欢他们”。
(2)语言样本的诱发方式:
可以采用谈话法、图片法或叙事的方式诱发儿童的语言样本。
1)谈话法:
即通过与儿童对话的方式诱发儿童语言样本。如,问儿童“这是什么?”让儿童介绍环境中或生活中的活动、物品、玩具来诱发儿童的语言或词汇等。
2)图片法:
即给儿童提供一些图片,让儿童根据图片内容进行讲述。但需要注意的是,图片一定是能够说明许多活动性质的图片,如果图片只显示很少的活动情形,没有什么可描述的内容,甚至只能诱发出命名,那就无法评估出儿童综合运用语言的能力了。
3)叙事:
即由儿童来说故事。故事的产生需要儿童组织语言,按照事件发生的时间顺序描述开始、中间与结尾等过程。采用叙事法收集语言样本时,可以就某一测试材料,如一篇小故事,评估人员先读一遍,接着再请儿童尽可能详细地重述一遍。有时也可与图片法相结合,给儿童提供一系列有前后逻辑顺序和故事情节的图片诱发儿童说故事。
2.语言样本的整理
Kenneth G.Shipley等人认为在对语言样本进行整理时除了要逐字转录当事人的整个语言样本外,还要注意以下一些方面:
(1)要包括语言背景中其他说话者的谈话,要注明所有句子的说话者是谁。
(2)转录到不清晰或部分不清楚的语句时,可以使用破折号(——),但要注明有几个字是不清楚的。
(3)尽可能少用标点符号。
(4)在句子结束时用“/”标示。
(5)转录时应连续记录每一个句子,但可以省略正式开始前的热身阶段的语句。
(6)语用分析除了需要记录相关的非语言背景信息外,还需要记录一些伴随言语产生的副语言线索(如语调和重音等)。
3.语言样本分析的内容
语言样本分析不仅要分析儿童语言中的错误,还要找出可以判定儿童交流水平的模式或规则方面的证据,以及影响语言产生的背景因素。具体可从以下几个方面进行分析:
(1)语言的形式:
儿童主要使用的单字、词汇还是句子。这些句子是否全部都是“主语-谓语-宾语”的形式;能否正确使用否定句、问句或是被动句;能否使用复杂句等。
(2)语义的理解:
儿童是否能够恰当地回答不同类型的问句(如什么、哪里、谁、怎样等);是否会对来自不同语义类别的词汇产生混淆等。
(3)语言的运用:
儿童是否表现出不同的语用能力,如要求提供信息、要求协助、回应、陈述等;能否进行会话轮替;能否表示会话的状态和对会话做出修补等。
(4)说话的速率:
儿童说话的速率是否过快或过慢、儿童与对话者之间的对话轮替是否有过长的停顿、儿童是否经常使用插入语或在说特定的字词前会先停顿、是否时常有词语的替换等。
(5)顺序性:
儿童是否能够有序地描述一件事情;是否能讨论最近发生的事情或重述一个故事等。
4.语言样本分析指标 (1)平均句子长度:
平均句子长度(the mean length of utterance,MLU)是反映儿童语法和词汇发育情况的指标。计算方法是以词素为单位对自然语言进行统计。普通话中词语没有形态的变化,其计算方法有2种,即以字为单位计算每句话中字的数量和以词为单位计算每句话中词的数量。计算公式如下:
在计算平均句子长度时,以下内容不计算在语言样本内:①模仿;②简略回答或是答非所问的语言样本;③不完整的句子;④不清晰的句子;⑤背诵的语句;⑥句子中做过自我更正,即改变原来的说法或是由于表达不连贯而重复(如口吃)的部分;⑦噪音;⑧口头禅或是语气助词;⑨相同的句子;⑩数数或列举。
(2)相异词出现率:
形符比(type-token ratio,TTR)即儿童语言样本中所使用的不同词汇在总词汇中所占的比例,是计算功能性词汇能力的一种指标,反映儿童使用词汇的多样性。计算公式如下:
如在一段语言样本中“我”出现了10次,在计算样本中不同词汇数时只算1次。国外研究发现,3~8岁儿童的相异词比率约为1∶2。
(3)会话能力评估指标:
会话能力的评估主要就是对话轮进行评估。评估的指标主要包括:①话轮的发起,包括口语发起、非口语发起以及口语伴随非口语发起;②话轮维持,包括言语维持、非言语维持以及言语伴随非言语维持;③话轮转换,包括话轮数、平均话轮句子数、平均话轮词汇数;④话轮中断,包括无回应、不能解释的回答、无意义重复;⑤话轮修补,包括会话修补的回应、会话修补无回应、会话修补不适宜回应;⑥会话的总体情况,包括会话发起数、会话维持数、会话修补数、会话中断数等。
(武慧多)