四、研究发现
(一)对分组随机性的检验
根据缓刑官的一系列个人背景特征,我们对实验组与对照组的缓刑官进行了比较。此外,我们还在培训开始之前,对缓刑官进行了有关风险/需求回应原则和服刑人员矫正方面文献的书面常识测验,并比较分析了实验组和对照组缓刑官的得分。上述两个方面均未发现实验组和对照组缓刑官有显著差异(如表1所示)。同样,对社区服刑人员的个人背景特征和犯罪前科方面的分析也表明实验组与对照组缓刑官所矫治的人员只有极少方面具有显著差异(如表2所示)。一个有趣的显著差异是社区服刑人员的种族,在对照组中“其他”种族(例如,亚裔和亚裔西印度群岛人)的社区服刑人员更为常见(χ2(2, N=143)=6.24; p=.044)。虽然我们要求缓刑官只招募中等和高度风险的社区服刑人员(共136人,在所有样本中占95.1%),但仍然有7个低风险的社区服刑人员也被纳入其中。由于不同的司法管辖区采用不同风险/需求评估工具,为了对社区服刑人员风险进行统一的测量,我们按照LSI-R量表中有关犯罪前科(Criminal History)组成部分的10个项目,以社区服刑人员的犯罪记录为依据,对他们的风险进行了重新测量。[1]无论是采用各司法管辖区各自的风险评估工具,还是采用上述后一种测量方法,实验组和对照组社区服刑人员的风险程度都是相当的。对社区服刑人员进行风险评估的结果实际上与之后两年的重新犯罪率相吻合,这一点不但适用于回顾性样本的分析(r=.17, p=.019, n=185),也适用于对预测性样本的分析(r=.37, p=.000, n=112)。
表1 STICS实验组与对照组缓刑官的特征
注:由于缺失部分缓刑官的数据,因此统计的总数(N)有所变化。所有t值和 χ2值均不显著。
表2 STICS实验组与对照组社区服刑人员的特征(实验组100人,对照组43人)
*由于部分参与本项研究的缓刑官在本项研究开始一年之前还未从事缓刑官的工作,所以在抽取回顾性样本时只包括了29个实验组的缓刑官和17个对照组的缓刑官所负责矫正的185个社区服刑人员。
在加拿大,法官可以对犯罪者作出一个缓刑考验期后附带一个监禁刑的裁判。此处同时判处缓刑与监禁刑即指这种情况。——译者注。
此外,实验组与对照组在接受培训前进行的社区矫正的有效性方面可能存在差别,也就是说,实验组或对照组中可能有一些缓刑官本身就较为擅长社区矫正。为了检验这种可能性,我们从每个缓刑官在参与本项研究前一年内的矫正对象中随机抽取了四个具有中等或高度危险性的社区服刑人员(即回顾性样本),并测量了这样抽取出来的185个社区服刑人员两年内的重新犯罪的数据。正如表2所示,对于这些回顾性样本的重新犯罪率,实验组与对照组之间并没有统计学上的显著差异。
(二)矫正会谈涉及的内容
所有矫正会谈的平均时长大约为26分钟(SD=11),而且实验组与对照组在会谈时长方面并没有显著差异(实验组为26分45秒,对照组为24分36秒,t(293)=1.43, p=.15)。另外一个变量是“对某一方面需求的讨论占整个会谈的比例(Proportion of Session)”,它是通过将涉及某一方面需求的5分钟片段的数量除以该次会谈中5分钟片段的总数来计算的。这一比例如果接近于1,则说明这一方面的需求几乎在本次会谈的每一个片段中都谈到了;这一片段如果接近于0,则说明本次会谈基本没有谈及某一方面的需求。通过对培训后所进行的矫正会谈的检验,我们发现实验组与对照组之间存在很多方面的显著差异。第一,对照组谈及就业/就学这一方面的犯因性需求明显多于接受了STICS培训的实验组。第二,实验组明显花费更多的时间来讨论亲犯罪态度,而无论社区服刑人员的亲犯罪态度是否已经通过评估被确定为一种犯因性需求。
表3 矫正会谈讨论的内容
* p<.05; **p<.01; ***p<.001.
此外,实验组会谈对犯因性需求的讨论(M=0.62; SD=0.28)占每次会谈的比例要显著高于对照组(t(293)=4.22; p=.000),而对非犯因性需求及缓刑条件的讨论则要显著低于对照组(t(293)=4.57; p=.000)。与实验组相反,对照组缓刑官在与社区服刑人员会谈时,将很多时间都用于谈论非犯因性需求和缓刑条件,因而是与“需求原则”相悖的。
还有一项变量为“谈及某一方面内容的会谈占所有会谈的比例”(% Sessions Discussed),即缓刑官与社区服刑人员涉及某一方面内容的会谈占所有会谈的比例。这一变量不考虑某次会谈的长度,也不对某次会谈谈及某一方面内容的次数进行计算,只考虑该次会谈是否谈到了某一方面内容,因而与“对某一方面需求的讨论占整个会谈的比例”略有区别。与STICS模式的要求相吻合,实验组对亲犯罪态度的讨论明显多于对照组,而不论社区服刑人员的亲犯罪态度被认定为一种犯因性需求(t(110)=2.64; p =.010),或者未被认定为犯因性需求(t(192)=2.59; p=.010)。
(三)缓刑官运用技术和干预方法的质量
在上述评价缓刑官在与社区服刑人员会谈中所运用技术和干预方法质量的五个方面内容中,有四个方面在实验组与对照组之间具有显著差异(如表4所示)。实验组缓刑官在组织会谈的技能(Structuring Skills)、建立关系的技能(Relationship Building Skills)、认知技术(Cognitive Tech niques)和总体有效矫正技能(global Effective Correctional Skills)四个方面获得了明显较高的质量评分。实验组缓刑官在行为技术(Behavioural Techniques)方面获得的质量评分(M=10.23)也高于对照组(M=8.67),但两者之间的差异尚不具有统计学上的差异性。
表4 参与培训后缓刑官技能水平评分
**表明具有显著差异(p<.01)。
STICS培训的一个首要的内容是提高缓刑官的认知干预技术(cognitive intervention techniques),以帮助他们能更有效地针对社区服刑人员的亲犯罪态度和认知开展工作。鉴于这一方面的重要性,我们专门分析了两方面的数据:一是有多少缓刑官在与社区服刑人员会谈时至少有一次涉及亲犯罪态度;二是有多少缓刑官在他们提交的录音资料中至少有一次运用过认知技术。数据分析发现,33位实验组缓刑官中有75.8%在会谈时至少有一次谈及亲犯罪态度,而在19位对照组缓刑官中,比例仅为10.5%,两者具有显著差异(χ2(1, N=52)=20.55; p=.001)。同样,实验组缓刑官中有69.7%在提交的录音资料中至少一次运用过认知技术,对照组19位缓刑官的这一比例则仅为5.3%,两者也具有显著差异性(χ2(1, N=52)=20.14; p=.000)。
(四)重新犯罪情况
培训结束后,实验组和对照组缓刑官所矫治的人两年内的重新犯罪情况存在差别(χ2(1,112)=2.71, p=.100)。实验组的75名社区服刑人员重新犯罪率为25.3%(95%置信区间为15.5到35.1),而对照组的37名社区服刑人员重新犯罪率为40.5%(95%置信区间为24.7到56.3)。两方面的差异性检验为(χ2(1,112)=2.71, p=.100)。此外,培训前和培训后实验组缓刑官矫治的人的重新犯罪率也存在差别。如上述表2所示,实验组缓刑官在参加培训前所矫治的120名社区服刑人员的重新犯罪率为46.7%,这与参加培训后矫治的社区服刑人员25.3%的重新犯罪率也有差别(χ2(1,195)=8.88, p=.003)。
社区服刑人员的年龄和LSI-R中的犯罪前科组成部分对于重新犯罪具有预测性的影响。犯罪前科组成部分对于重新犯罪的预测效度已经在上文列出;在回顾性样本中,年龄与重新犯罪的相关为-0.07(p=.372, n=185);而在预测性样本中,年龄与重新犯罪的相关为-.32(p=.001, n=112);在所有样本中,这一相关为-.16(N=297)。图1展示了在控制年龄和犯罪前科(运用LSI-R进行的测量)这两个变量的情况下,回顾性样本、实验组和对照组社区服刑人员重新犯罪的生存率(survival rates for the recidivism)。与对照组和回顾性样本中的社区服刑人员相比,实验组社区服刑人员未重新犯罪的生存时间最长。
图1 实验组与对照组回顾性样本与预测性样本社区服刑人员重新犯罪生存情况(控制了年龄和犯罪前科的影响)
我们还检验了另外两方面值得关注的领域及其与重新犯罪的关联性。一方面,由于培训关注于通过运用认知技术来改变社区服刑人员的亲犯罪态度,我们对部分社区服刑人员的重新犯罪率进行了检验,以识别缓刑官运用认知技术是否以及如何影响重新犯罪。数据分析发现,曾被缓刑官运用过认知技术的42名社区服刑人员的重新犯罪率为19.0%,而其余未被运用过认知技术的70名社区服刑人员的重新犯罪率为37.1%,两者之间存在差别(χ2(1,112)=4.07, p=.044)。
另一方面,我们对录制于社区矫正开始时的录音资料中谈及缓刑条件的内容进行了分析,以与之前的研究保持一致。[2]在控制了会谈时长和社区服刑人员在风险/需求方面的差别后,数据分析发现,谈及缓刑条件的5分钟片段的数量与重新犯罪率正相关(r=.25, p=.052)。由于对录音资料进行的编码是5分钟一个片段,我们改为采用15分钟作为一个分界点。这一变化显著减少了我们的样本数量(减至14个)和数据的说服力,但仍然能显示一定的趋势。在社区矫正开始时在与缓刑官的会谈中花费超过15分钟来讨论缓刑条件的14名社区服刑人员的重新犯罪率为50.0%,而其他97名社区服刑人员的重新犯罪率为27.8%,两者之间存在差异(χ2(1,111)=2.83, p=.093)。
在导致社区服刑人员行为改变的技术(techniques of influence,例如建立关系的技能和组织会谈的技能)方面,在控制社区服刑人员的风险(即LSI-R的犯罪前科组成部分)这一变量后,只有认知技术对于重新犯罪有预测性的影响。对所有缓刑官来说,皮尔逊积差相关数(Personproduct correlation)为-.25(n=109; p=.009)。
(五)后续的诊所式的技术支持
诊所式的技术支持通过月度会议、个案反馈和更新课程来提供。我们对于以上三个方面的内容采用不同的方法来评价每个缓刑官对诊所式技术支持的参与情况。对于月度会议而言,根据对分法并依照月度会议的到会情况,缓刑官会得到不同的分数:到会5次及以下的缓刑官得1分,而到会6次及以上的缓刑官得2分。这一分数再乘以在月度会议中的表现的评分,所得的最终分数(从1到6)再以对分法加以区分。[3]对于个案反馈这一方面,两份或更多录音资料得到反馈的缓刑官得到2分,一份录音资料得到反馈的缓刑官得到1分,而13位未得到任何反馈的缓刑官则得到0分。对于更新课程这一方面,参与了更新课程的缓刑官得到1分,而没有参与的则得到0分。将上述三个方面的得分累加起来,会得到一个“继续开展社区矫正(On-Going Supervision)”的总得分(平均得分为2.7分,SD=1.5)。为了便于分析,我们基于这一总得分将缓刑官分为两组:总得分在3分及以下的缓刑官被分入“低度参与(low-participation)”组,而总得分在4分及以上的缓刑官被分入“高度参与(high-participation)”组。
基于那些自首次为期3天的培训结束后9个月以后录制的会谈录音资料,我们分析评估了缓刑官在较长时间内如何运用培训所授技术以及与社区服刑人员谈话的内容。在实验组的33位缓刑官中,共有23位缓刑官提交的76份会谈录音资料符合这一标准,因而成为我们分析的样本。实验组中有10位缓刑官提交的所有会谈录音资料均在9个月这一期间以内,所以未纳入此项分析。通过此项分析,我们可以了解到缓刑官在绝大部分后续的诊所式技术支持结束以后的矫治行为。
对于此项分析,我们的预期是,后续诊所式技术支持活动参与越多,将会提高缓刑官的矫正技能和与社区服刑人员的谈话质量。如表5所示,诊所式技术支持活动的三个方面和继续开展社区矫正的总得分都与认知技术的运用呈正相关关系。虽然p值未达到统计学上显著性要求的.05,但缓刑官在较长时间内运用组织会谈的技能、行为技术和总体有效矫正技能,也与参与后续诊所式技术支持活动的程度呈正相关关系。只有建立关系的技能的运用未呈现出与参与程度的正相关关系,相反,呈现出一种影响极小甚至负相关的关系。在会谈内容方面,也同样呈现这样一种正相关关系:参与后续诊所式技术支持活动的越多,对培训所要求或希望谈及的内容讨论越多。例如,对亲犯罪态度的讨论很多,而对非犯因性需求的讨论很少。虽然没有达到统计上的显著性,但会谈中谈及犯因性需求所占的比例也与参与后续诊所式技术支持活动的程度呈正相关关系。
表5 缓刑官在较长时间内技能运用与会谈内容与后续诊所式技术支持活动参与程度的相关性检验(样本数量:23位缓刑官)
* p<.10; **p<.05
正如上文所述,23位提交了9个月之后会谈录音资料的缓刑官被分为两组:一组是高度参与组(继续矫治总得分在4分及以上,共有10位缓刑官);另一组是低度参与组(继续矫治总得分在3分及以下,共有13位缓刑官)。表6全面展示了两组之间的差异。方差分析的结果显示,两组在认知技术运用方面存在显著差异(F(2,39)=14.91, p<.001),在总体风险/需求回应模式技术运用方面也存在显著差异(F(2,39)=4.71, p=.015)。在会谈内容方面,两组在四个方面的内容上都存在显著差异。此外,我们还发现,高度参与组缓刑官所矫治的人的重新犯罪率为22%,而低度参与组缓刑官所矫治的人的重新犯罪率为27.1%。
表6 高度参与组(10人)与低度参与组(13人)技能运用与会谈内容比较
*方差分析(ANOVA)p<.05
[1] LSI-R量表是世界范围内对犯罪者进行风险评估运用最多的量表之一。LSI-R量表由54个风险或需求评估项目组成,这54个项目被分为10个组成部分,其中犯罪前科(Criminal History)是第一部分。其他组成部分则用于测量不同的犯因性需求,例如工作、教育和亲犯罪态度(procriminal attitudes)。犯罪前科部分由10个评估项目组成,例如犯罪的数量、以往的定罪后监禁和16岁以前的逮捕记录。——译者注
[2] Bonta, J. , Rugge, T. , Sedo, B. , & Coles, R.(2004). Case management in Manitoba probation(User Report 2004-01). Ottawa:Public Safety and Emergency Preparedness Canada; Bonta, J. , Rugge, T. , Scott, T. , Bourgon, G. , &Yessine, A.(2008). Exploring the black box of community supervision. Journal of Offender Rehabilitation,47,248—270.在上述2004年和2008年的两项研究中,研究者发现花费太多的时间去讨论缓刑的条件反而会起到相反的作用,为了进一步确证这一发现,本项研究中又采用前两项研究中所使用方法对这一问题进行了分析。——译者注
[3] 首先把到会情况区分为高低两种并赋予相应1分或2分,之后到会的缓刑官在会议中的实际表现也被赋予相应的分数(1分为表现较差,2分为表现一般,3分为表现良好)。再将这两个分数相乘,最终得到的分数最高为6分,最低为1分。这样的两方面测量不但能体现到会情况,而且可以体现参会的质量,最终能够全面测量参与月度会议的状况。——译者注