第三章 效度验证框架与方法
测试效度验证是语言测试领域一个永恒的主题。在我们根据考生在测试中的表现做出任何推论或决定前,均应首先对该测试的效度进行验证,在计算机辅助语言测试中,对测试效度的验证显得尤为重要。但是目前很少有研究探讨根据计算机辅助语言测试中的成绩进行推论的有效性(Bachman, 2000;Shin, 2007)。无论是普通的计算机辅助语言测试还是计算机自适应语言测试,相关的效度研究寥若晨星。
为了帮助测试开发者与使用者更好地理解效度并进行效度验证研究,在过去的二三十年中,众多专家学者相继从不同角度提出了不同的理论与方法,如效度整体观(Messick, 1989)、构念效度(Bachman, 1990; Bachman & Palmer, 1996)、测试后效(Wall & Alderson, 1993; Messick, 1994, 1996; Bailey, 1996;Cheng, 1999)、测试公平性(Kunnan, 2004)、测试伦理(Stansfield, 1993; Davies, 1997; Hamp-Lyons, 1997; Lynch, 1997; Spolsky, 1997)、语言测试的社会维度(McNamara, 1998, 2006, 2007; McNamara & Roever, 2006)以及批判语言测试(Shohamy, 1998)等。
尽管这些理论与方法在很大程度上增进了研究者对效度概念的理解,但是这些理论均过于笼统和抽象,在实践中不具有很强的可操作性。因此,近年来,基于论据的效度验证方法(argument-based approach)受到越来越多研究者的青睐,如Mislevy et al(. 2003)的以证据为中心的方法(evidence-centered design)、Kan(e 1992, 2001, 2004, 2006)的解释性论据(interpretive argument)。在这些基于论据的效度验证方法中,由Bachman(2003, 2005)提出,并由Bachman & Palmer(2010)最后修正的“测试使用论证”(assessment use argument,简称AUA)框架能够最全面、最系统、最连贯地阐述测试开发、测试分数解释与测试结果使用之间的关系,因此受到了语言测试研究者的广泛认可与赞同。