王辉:当代西方循证犯罪预防研究简述及启示
王辉【摘要】当前西方国家使用循证方法开展犯罪预防研究比较盛行,并产生了一批重要的研究成果,但我国还没有将此方法引入刑事司法领域。犯罪预防评估可以采取多种方法,其中表决计分评价法、系统性评价法和荟萃分析法是主要的循证方法。我国亟待在刑事司法领域引入循证研究方法,借鉴西方已有的循证犯罪预防研究成果为我所用,重视西方循证犯罪预防研究结论在我国的转化问题,努力为我国刑事司法理论研究和政策制定的科学化创造条件。
【关键词】循证;犯罪预防;表决计分评价法;荟萃分析评价法;系统性评价法
近二十年来,西方国家刑事司法领域一种名为“evidence-based crime prevention”(简称EBCP)的研究方法比较盛行,并逐渐演化成一种国际趋势。据笔者不完全统计,美国、英国、德国、法国、加拿大、澳大利亚、新西兰、瑞典、西班牙等国家都在开展“evidence-based crime prevention”的相关研究。“Evidence-based”一词最早出现在医学领域。鉴于其研究方法的科学性,这种研究方法迅速扩展到公共政策决策、教育和犯罪预防等多个领域。本文拟在介绍和简述“evidence-based crime prevention”的基础上,提出一些粗浅的看法。
一、当代西方循证犯罪预防研究简介
(一)“evidence-based”一词的翻译问题
“Evidence-based”一词的本意为“在证据基础上”,上世纪90年代引入中国后,医学界最早将其翻译为“循证”,例如将“evidence-based medicine”翻译为“循证医学”,将“evidence-based nursing”翻译为“循证护理学”。虽然有人对“循证医学”的译法提出过异议,认为应当翻译为“证据医学”{1},但实际上我国医学界已经普遍接受“循证医学”的概念。从语言学上讲,“循”有“依据”的含义,“循证”即依据证据,与“evidence-based”一词本意相符。考虑到词语翻译的简洁性、准确性和惯例,我认为将“evidence-based”一词翻译为“循证”是准确和适当的,“evidence-based crime prevention”相应翻译为“循证犯罪预防”。
(二)西方循证犯罪预防研究的主要成果
循证犯罪预防研究的历史并不长。有人认为最早在犯罪预防领域开展循证研究的是利普顿(Lipton),他1975年对矫正处遇项目进行了评估研究{2}。20世纪80年代开展了一些反驳“马丁森炸弹”以及评估犯罪预防替代刑事效果的研究。20世纪90年代以来,受循证医学研究和应用的积极影响,循证犯罪预防研究产生了一些重大成果。例如,克拉克(Clarke)1992年出版的《情境犯罪预防:成功的案例分析》(Situational Crime prevention:Successful Case Studies),唐瑞(Tonry)和法林顿(Farrington)1995年出版的《建立一个更加安全的社会:犯罪预防的战略方法》(Building a Safer Society:Strategic Approaches to Crime Prevention)。美国着名学者谢尔曼(Sherman)等人1997年向美国全国司法研究所提交了《预防犯罪:什么是有效的,什么无效的,什么是有希望的》(Preventing Crime:What Works,What Doesn't,What's Promising)的研究报告,并且2000年在此基础上出版了《循证犯罪预防》(Evidence-based Crime Prevention),这是循证犯罪预防研究的里程碑。2006年出版的由韦尔什(Welsh)和法林顿(Farrington)共同主编的《预防犯罪:什么对孩子、犯罪人、受害人和场所是有效的》(Preventing Crime:What Works for Children,Offenders,Victims,and Places),德国施普林格(Springer)出版公司于2011年出版了由谢尔曼(Sherman)和斯特朗(Strang)主编的《施普林格循证犯罪政策系列丛书》(Springer Series On Evidedence-based Crime Policy),包括《在社区矫正和戒毒治疗领域开展循证研究》(Implementing Evidence-Based Practices in Community Corrections and Addiction Treatment),《循证反恐政策》(Evidence-Based Counterterrorism Policy)和《把犯罪恐惧映射在地图上--运用地理信息系统对犯罪感的研究》(Putting Fear of Crime on the Map-Investigating Perceptions of Crime Using Geographic Information Systems)是循证犯罪预防研究的最新力作。此外,在非英语世界也有一些循证犯罪预防的着作,例如德国格拉布施(Graebsch)2009年出版的《循证犯罪预防:基于预防犯罪政策的重要性、可能性和实验研究的局限性》(Evidence-based Crime Prevention:Bedeutung,Moglichkeiten und Grenzen einer auf experimentelle Forschung gestutzten Kriminalpra ventions politik)和2011年出版的《什么是有效的?什么是无效的?谁来关心?“循证刑事政策”和青少年犯罪政策的现实》(What works?-Nothing works?-Who cares?,Evidence-based Criminal Policy“und die Realitat der Jugendkriminalpolitik)。上述着作反映了当代西方循证犯罪预防研究的主要成果。
(三)西方循证犯罪预防研究的主要方法
韦尔什(Welsh)和法林顿(Farrington)认为,循证犯罪预防研究的方法包括单一研究评价法(Single Study Review Method)、叙述性评价法(Narrative Review Method)、表决计分评价法(Vote-Count Review Method)、系统性评价法(Systematic Review Method)和荟萃分析法(Meta-Analytic Review Method){3}。单一研究评价法和叙述性评价法不太严格,因此循证犯罪预防研究较少采用这两种方法,而表决计分评价法、系统性评价法和荟萃分析法的评价质量很高,因此更多地用于循证犯罪预防评估。在评价犯罪干预有效性方面,系统性评价和荟萃分析评价是最严格的方法。最近的10多年以来,高质量研究证据的系统性评价,包括荟萃分析方法,在发达国家的社会科学领域得到越来越普遍的重视,特别是在刑事司法领域。下面分别介绍表决计分评价法、系统性评价法和荟萃分析法。
1.表决计分评价法
1996年,美国国会通过一部联邦法律,要求总检察长提供一份独立评估报告,就司法部犯罪预防补助拨款计划的实施效果进行评估,并要求必须采用严格的、科学的、公认的评估标准和方法。受全国司法研究所委托,以谢尔曼(Sherman)教授为首的研究小组承担了此项评估任务,他和他的同事提出了一种全面的表决计分评价法(Vote-Count Review Method),称为”马里兰科学方法测算表“(The Maryland Scale of Scientific Methods)[1]。这种表决计分评价法没有采用有关许多特定标准的计分总和的方法(如从0到100),而是使用了一种简单的5点等级,主要目的是为了设计测算内在效用的一个简单等级,以便于理论学者、政策制定者和实际工作者进行交流和沟通。这5个等级分别为:
1级:在一个时点上预防计划和犯罪测算值之间的相关性(例如,安装闭路电视监控系统区域的犯罪率低于未安装该系统的区域)。
2级:在不可比的控制条件下,预防计划之前和之后的犯罪测算值(例如,在某个区域安装闭路电视监控系统之后,犯罪率下降了)。
3级:在实验的和可比的控制条件下,预防计划之前和之后的犯罪测算值(例如,在实验区域安装闭路电视监控系统之后犯罪率下降了,但在可比控制区域犯罪率没有下降)。
4级:在多实验和控制单位条件下,即控制影响犯罪的其他变量,在预防计划之前和之后犯罪测算值(例如,在控制影响他们受害的前提条件特征之后,在闭路电视监控系统监视前提条件下的受害比控制前提条件的受害下降了)。
5级:把预防计划和控制条件随机地赋值给单位(例如,随机赋值给闭路电视监控系统监视的前提条件的受害比控制前提条件的受害下降了)。
其中,1级设计无法排除对内在效用的许多威胁,也无法建立因果关系的顺序。2级设计建立了因果关系的顺序,但无法排除对内在效用的许多威胁。3级设计能排除对内在效用的许多威胁,例如历史、成熟趋势、使用仪器、测试效果、微分损牦等,但主要问题体现在选择效果上和均值回归上,因为实验和控制条件是非等价的。4级设计能够更好地控制外在影响,从而可以更加适当地处理选择和回归威胁。在5级设计下,如果随机赋值的单位数目足够大,在影响结果的所有可能外生变量当中,在统计波动的界限内,实验条件变量将等于控制条件变量。因此,这个设计可以处理选择和回归问题,而且具有最大可能的外在效用。
谢尔曼等人认为,1级和2级设计是不科学的,无法评估计划的有效性。3级至5级设计的解释力是逐渐增强的,其中3级设计具有最小的解释效力,而4级和5级设计具有严格的解释效力。分级评价的目标是把所有计划类型分为四类:什么是有效的,什么是有效的,什么是有希望的,什么是未知的[2]:
什么是有效的。存在一些在各种社会背景下的预防犯罪计划,并且已经在这些背景下评价过这些计划。作为有效的计划,至少必须有3级至5级当中的两个评价值,从而说明具有统计显着性和合意的结果,以及证明有效性的所有可用证据是占优的。
什么是无效的。存在一些无法预防犯罪的计划。作为无效的计划至少必须有3级至5级当中的两个评价值,利用统计显着性测试说明无效性和支持同样结论的所有可用证据是占优的。
什么是有希望的。存在一些计划,在这些计划中,从可用证据中得到的确定性水平太低,以至于不支持可概括的结论,但存在某种实验基础,从而断言,进一步的研究可能支持这个结论。作为有希望的计划,必须在3级至5级中有一个评价值可以说明显着性测试是有效的,而且剩下证据占优性的显着性测试也是有效的。
什么是未知的。任何无法归类为以上三种的计划可以定义为具有未知效应的计划。
表决计分评价法的优点是考虑了统计显着性,为叙述性评价增加了定量的因素,吸纳了系统性评价法和荟萃分析的部分内容,具有很大的效用。但是这种评价方法也有一定的局限性,如不考虑方法的特性而对所有研究赋予相同的权重。
2.荟萃分析评价法
荟萃分析法(Meta-Analytic Review Method)是指用统计合并的方法对具有相同研究目的的多个独立研究结果进行比较和综合分析的研究方法。传统的文献综述是对有关文献的内容或结论进行罗列、简单描述和初步论述,荟萃分析则是将已经获得的研究结果进行综合分析,特点是用统计分析方法验证有效的结论,从而更为科学、客观地综合反映研究成果。
这种方法首先应用于医学领域,并发展成为一门新兴学科--”循证医学“的主要内容和研究手段。从医学领域来看,根据荟萃分析所依据的基础或数据来源,可以将其分为三类:文献结果荟萃分析(Meta-analysis based on literature,简称MAL);综合数据荟萃分析(Meta-analysis based on summary data,简称MAS);单个病人数据荟萃分析(Meta-analysis based on individual patient data,
简称MAP或IPD Meta-analysis)。这三种分析方法的特点分别是:文献结果荟萃分析的文献检索局限于已经发表的研究,然后将这些研究的结果进行综合分析;综合数据荟萃分析不仅要收集已发表的相关文献,还要收集原作者关于相关统计数据的概述;单个病人数据荟萃分析除了要检索所有已发表的相关文献,还要寻找各科学团体未发表的有关研究报告,进一步扩大了文献范围。
荟萃分析要求对先前的研究论文结论进行统计或定量分析。由于这个分析涉及到统计数据的汇总,它要求合理数目的犯罪研究,并且数目要多到足以进行汇总。如果研究的数目非常小,在平均效应规模方面可能几乎没有报告点。但是,在帮助评价人员确定一个具体干预的平均效应方面,定量方法会是非常重要的。荟萃分析的一个主要指标是加权平均效应规模,尽管通常也没有人尝试研究一些因素,它们可以预计不同研究中的较大或较小效应规模。每个效应规模是根据其基于的样本规模进行加权,在计算平均值时,较大的研究具有更大的权重。
荟萃分析评价法的优点主要体现在它的透明性方面。荟萃分析评价法能够处理非常大量的研究论文,其他研究人员也很容易复制,相对于其他评价方法来说,这可能是荟萃分析法的绝对优势。同时,荟萃分析的统计方法有助于防止把结果中的离差解释为有意义的误差,正如容易把它解释为样本误差。荟萃分析评价法也有一定的缺点,例如它无法综合处理单个研究中发现的效应范式,入选的研究报告可能良莠不齐,原始研究报告质量直接影响荟萃分析结论之正确性等。
3.系统性评价法
系统性评价法(Systematic Review Method)是一种通过严格程序来考察给定研究问题的研究结论一致性的研究方法。系统性评价法最早出现在流行病学研究中,后来才引入到犯罪预防领域。坎贝尔联盟犯罪与司法研究小组(Campbell Collaboration Crime and Justice Group)在把系统性评价应用于刑事研究领域方面处于领先地位。该小组系统性评价的主要特征如下:
--明确的目标。进行这种评价的论据是清楚明确的。
--明确的合格性标准。验证人员详细地说明为什么他们包括特定的研究,而不包括其他研究。
--查找研究的目的是为了减少潜在的偏差。由于有许多潜在的方法,利用这些方法偏差可以影响评价的结果,因此验证人员必须明确地说明为了减少这种偏差他们如何查找潜在研究的。
--根据合格性标准筛选每项研究,并证明排除的研究是正确的。潜在的相关研究的每个报告必须经过筛选,以确定其是否符合评价的合格标准。所有排除的研究都要完整列出清单,而且读者应当能够得到排除的理由。
--汇集最完整的、可能的数据资料。应尽量设法得到符合合格标准的所有相关评价。此外,与评价目标相关的所有数据应当从每个合格的报告中仔细地萃取出来,并且进行编码和电脑处理。如果可能的话,系统性评价的人员会设法从原报告的作者那里获得数据。
--适当且可能时,采用定量分析方法分析结论。系统性评价可以包含或可以不包含荟萃分析法。有的研究可能不适宜采用荟萃分析法。但是若条件适合,应当把荟萃分析法作为系统性评价的组成部分。
--结构性和详尽的报告。系统性评价的最终报告是结构性的和详尽的,使得读者能够理解研究的每个阶段、作出的决定,以及获得的研究结论。
坎贝尔联盟犯罪与司法研究小组系统性评价有以下几个步骤[3]:
(1)系统性评价学者或指导委员会确定研究问题或课题;
(2)学者把研究课题的建议和期望得到的完整数据递交给相关协调指导委员会主席及(或)协调人把项目分配给总顾问;
(3)学者在总顾问的协助下完成和递交草稿;
(4)总顾问和编辑组审核草稿;
(5)总顾问批准草稿,并递交给C2-RIPE;
(6)学者完成草稿审核并递交给总顾问;
(7)总顾问征求外部意见,并获得编辑组对草稿的批评意见;
(8)学者从编辑组收到反馈意见(这一步可以多次反复);
(9)学者递交最终评价报告;
(10)在《干预和政策有效性坎贝尔协作评论》发表评价报告;
(11)评价报告发展用于多受众者。
系统性评价的优点是全面、系统,整个过程非常明确,具有良好的可重复性。既可以进行定性分析,也可以进行定量分析。不过,系统性评价也有其局限性,例如作为系统性评价的内容,为什么一些研究包含在内而另一些研究被排除在外?所设定的严格性的上限到底有多高?这是所有研究人员都要面临的问题。
二、几点启示
1.亟待将西方循证方法引入我国刑事司法研究领域。循证犯罪预防研究是一种研究犯罪预防的新思维和新方法。西方国家在循证医学研究兴起不久便将循证方法引入了犯罪预防研究领域。致力于循证医学研究和应用的考科蓝协作(Cochrane Collaboration)成立于1993年,而致力于犯罪与司法研究的坎贝尔联盟(Campbell Collaboration)成立于2000年,两者仅相差7年。反观我国,自20世纪90年代开展循证医学研究以来已有20年左右的时间,但迄今为止,在我国几乎仍看不到有关循证犯罪方法在犯罪预防和政策决策中的引入和介绍,更谈不上应用了。将循证方法引入犯罪学、刑事政策学研究领域是国际刑事司法理论研究的一个必然趋势,也是提高我国犯罪预防理论和政策研究水平,增强刑事政策决策科学性的必然选择。
2.我国应当重视和鼓励采用循证方法开展研究。循证犯罪预防研究既是当前国际上刑事司法领域研究的一个热点,有较强的理论研究意义;也是很多国家司法决策的重要参考,有广泛的应用前景。循证犯罪预防在亚洲正逐渐成为研究热点。亚洲犯罪学协会(Asian Criminological Society)2012年8月将在韩国首尔举办第四届年会,其主题之一就是”亚洲司法科学和循证刑事政策“(Forensic Science and Evidence-Based Criminal Policy in Asia)[4]。在我国的司法理论和政策研究中,因种种原因长期缺乏统计和实证研究。我国开展循证犯罪预防研究的潜力和前景都很大。引入循证研究方法后,可以全面、系统、定量地评估我国哪些犯罪预防措施是有效的,哪些措施是无效的。对于有效的犯罪预防措施要加大实施力度,对于无效的措施应及时停止。这既有利于提高犯罪预防措施的针对性和有效性,也有利于节约社会成本,将公共资金用于其他更加急需的项目。
3.西方循证犯罪预防研究的一些结论可以为我所用。当前发展中国家循证犯罪预防研究远远落后于其他西方国家,中国几乎是空白。一项有关发展中国家开展循证犯罪预防研究的调查表明,在发展中国家开展的符合西方严格意义上的循证研究非常之少{4}。我们要想在短期内追赶上西方发达国家循证犯罪预防研究的水平不太现实。既然西方已经采取非常严格的方法进行了大量的循证犯罪预防研究,并且有的研究还将被评估计划的可推广性作为评价的标准之一(如谢尔曼的研究),那么我们不妨将其中具有较大可推广性的研究成果借鉴到我国犯罪预防政策中,作为政策制定者、决策者的一个重要参考指标,或者应用于我国的某些验证性研究,作为加快我国循证犯罪预防研究的一个基础。
4.重视西方循证犯罪预防研究结论在我国的转化问题。不同国家之间循证犯罪预防的结论是否可以推广应用具有很多不确定性。由于国与国之间在政治、经济、文化等方面存在诸多的不同,在一个国家证实有效的犯罪预防策略,在其他国家可能没有效果。这种结果可能是多种原因导致的。在进行国际比较研究时,最大的挑战是提出循证研究所得出结论的标准,以更严格的方法和更大的普适性来寻求成本和收益之间的合理平衡。具体到我国而言,在借鉴其他国家一些循证犯罪预防研究结论的时候,要特别注意不能盲目相信,直接照搬,应当在我国开展相应的研究,并进行验证。这样才能更好地适应我国国情,为决策者提供切合实际的证据。
5.努力为我国刑事司法理论和政策的定量研究创造条件。在我国刑事司法领域应用循证犯罪预防研究方法,要求现有的理论研究人员关注数理统计理论和方法,而且,在大专院校和研究机构,也要注重培养跨学科人才,尤其是把数学列入法学教学课程,为我国司法刑事理论的现代化奠定必要的人才基础。同时,在保证国家安全的前提条件下,进一步提高司法统计数据的透明度,为理论研究人员开展司法政策有效性的定量分析创造必要的条件。
王辉,北京师范大学刑事法律科学研究院刑法学专业2011级博士研究生,研究方向:犯罪学、监狱学。
【注释】
[1]https://www.ncjrs.gov/pdffiles/171676.PDF.2012—05—30.
[2]同注释⑴。
[3]http://www.campbellcollaboration.org.2012—05—30.
[4]http://www.ntpu.edu.tw/college/e4/acs/files/meeting/20120306152046.pdf.2012—05—30.
【参考文献】
{1}佚名.如何翻译“evidence—based medicine”一词{J}.广州医药,2002,(2):73.
{2}Jan V.Dijk.Crime Prevention in a Globalized World:Foundation Setbacks and Challenges{M}.Presentation at the Opening Plenary of the Conference on Sustainable Prevention Policies and Practice:Present And Future Challeges,December 1,2004.
{3}Brandon C.Welsh&David P.Farrington,eds.Preventing Crime:What Works for Children,Offenders,Victim and Places{J}.(New York:Springer,2006),pp.5—10.
{4}Roger Bowies et al.,Evidence—based Approaches to Crime Prevention in Developing Countries{J}.European Journal on Criminal Policy and Research(2005)11:348.