胡铭:数字法学研究的实验方法与风险防控
胡铭摘要:随着数字时代的到来,面对进一步复杂化的法律系统,数字法学研究有必要引入实验方法。相较传统的实证法学研究方法,实验方法在挖掘数据规律、确定变量之间因果关系等方面具有可复制性、可验证性等优势。数字法学实验通过打破学科壁垒、形成数字法治学术共同体,面向不同应用场景构建法学知识图谱,在此基础上展开仿真模拟实验以实现预测和验证目标。此外,在引入实验方法时,要注意数字实验可能造成的数据安全风险、伦理风险、形式主义风险和可靠性风险,使实验方法成为具有生命力和创造力的数字法学研究方法。
现下,人类社会经历农业时代、工业时代及20世纪末的信息时代后,在云计算、大数据等科技革命的助力下向着数字时代狂奔。在此背景下,工业时代的法律规则与法学理论被不断地质疑、解构与重新阐释,传统法学范式的危机逐步显露,日趋规范性的数字法学体系呼之欲出。随着大数据、区块链等信息技术与司法领域的深度融合,如何在概念化、条文化、体系化等传统规范实证的要素之外追寻法学的客观性与科学性,成为因应时代变化的重要理论议题。借由前所未有的司法数据体量、日益精准的数据分析技术,法学领域利用经验实证方法产生了一大批聚焦法律实效的针对性理论成果。然而,现有的数字法学研究仍主要基于对已然的法律事实或材料进行归纳、分析,借此发掘现象间的因果关系,勾勒出社会中“真实的”法律制度。当然,这无疑是法学研究中极为重要的一个方面,但可惜的是,更具创造性、科学性与可验证性的实验方法长期以来受到忽视,甚至有大量观点排斥将实验方法引入法学领域。事实上,实验方法作为分离变量、研究因果的首要工具,合理的实验设计所具有的严密的逻辑性是其他观察方法所无可比拟的。顺应数字化的时代浪潮,法学应当承认实验方法的重要性,将“法学是否应当引入实验方法”的争论转变为“法学实验如何更具可验证性与可操作性”的追问。
从自然科学实验到社会科学实验:学术史的初步梳理
实验方法是一种总结经验并用经验证据论证或反驳命题的方法,包括社会科学在内的各类实证科学都在普遍使用。与以往的社会科学研究方法相比,实验方法更具科学的精确性和可验证性。自然科学的实验是为了发现真理,事先做一个假设,再通过可重复的实验来证明或证否该假设。但是,社会科学的实验方法,或者说是法学中的实验方法,并不完全等同于自然科学的实验研究。法学中的实验方法的可能目的是发现法律运行过程中的规律,当前针对大数据的实验就是为了发现隐藏在大数据中的规律和特征,反映了法律实践自身的特点。为了理解为什么法学可以运用实验方法,在此,有必要对从自然科学实验到社会科学实验的学术史做基本的梳理。
(一)启蒙时代自然科学实验方法的兴起
纵览近现代自然科学发展的历史脉络,其兴起的时期大致可定位在以神学和经院哲学占绝对主导地位的中古世纪之后。事实上,现代科学所彰显的理性精神及相应的研究方法并非立刻脱身于经院哲学,而是经历了漫长的发展过程。在中古世纪时的西方,经院哲学的目的是论证早已被肯定的、尽人皆知的基本真理,其对象是超验的世界、上帝和灵魂等问题。与此相应,哲学家的任务不过是对上帝赐予、由教会传达的真理加以解释,使其同其他知识联系起来从而便于理解,因此,哲学不过是神学的“婢女”,自然科学也不受重视。而为了“于当代诸权威之中求得一席能自由呼吸的天地而已”,科学实证方才以反抗传统权威的姿态走入历史。在此过程中,达•芬奇、伽利略、开普勒以及牛顿等人均试图通过机械论思想解释自然现象,在一定程度上排斥传统解释对象的神学色彩。
从16世纪开始,数学学习的兴起、科学方法的建构以及经验结果的积累均加速了欧洲科学革命的出现。其中,弗朗西斯•培根是科学革命的典型代表,其科学思想在于强调在自然科学中依靠经验归纳逐步构建命题并系统地观察与实验的重要性。培根拒绝了经院哲学所重视的理性演绎方法,在他看来,“精神或理性能对感官所提供的材料进行加工,知识是理性的,又是实验的;而理性本身却不出真理。”唯有通过真正的归纳法,把实验同理性能力结合起来,才能理解事物本身。因此,培根宣称:“我不是要从事功中引出事功,或从实验中引出实验(像一个经验家),而是要从事功和实验中引出原因和原理,然后再从那些原因和原理中引出新的事功和实验,像一个合格的自然解释者。”而在同一时期,笛卡尔则强调怀疑自我存在以外的一切。笛卡尔相信,数学作为最确定的知识形式,为科学提供了基础。因此,与培根的实验主义不同,笛卡尔的理性主义更为强调演绎方法,即根据人类理性尤其是数学演绎推理的方法发现整个物理宇宙的运行定律。但这并不代表笛卡尔不重视实验方法。相反,笛卡尔认为实验方法是理性思考的必要手段:“为了解除这个困难,我认为没有别的办法,只有安排一套实验,根据实验结果不同来决定该用哪一种方式来解释”,“我在认识自然方面能有多大进展,就看我今后能有条件做多少实验。”
除了培根与笛卡尔之外,同时代的伽利略更是宣称,一切全称命题(Universal Statement)都应该以观察和实验为基础,理想的研究方法是建立在实验、观察和思维之上的论证。牛顿试图将经验主义和理性主义在科学方法中结合起来。牛顿认为,仅靠实验而缺乏理论的解释,又或是仅靠理论演绎而缺乏实验的证明,都不可能得到可靠的知识。而牛顿也正是依靠二者实现了其一系列的理论建构:“首先通过实验对观察现象进行化简;其次是借助微积分对实验化简后的现象进行阐述;再次进行严格的实验来证实最终的结论。”因此,通过综合培根的实验主义和笛卡尔的理性主义,牛顿呈现了近代“科学”概念的雏形。
总之,时代启蒙所展现的经验主义思潮和理性主义思潮的激烈碰撞,引发了何谓真理、如何认识真理等一系列问题的深入思考。而自然科学也受益于研究方法的改变,获得了令人炫目的成果。在此过程中,实验方法发挥了重要作用,既为经验主义者提倡,也被理性主义者所运用。
(二)社会科学研究方法的自然主义转向
自然科学的辉煌影响着社会科学的发展。长久以来,社会科学哲学处于自然科学哲学的余荫之下:为了提升 “科学地位”,社会科学哲学的基本主旨就在于反思自然科学所取得的成功方法,并将其引入到社会科学之中。在自然科学成为社会科学的“新权威”之前,其影响已经有所体现,比较著名的例子包括霍布斯在《利维坦》中体现的机械唯物主义、斯宾诺莎在《伦理学》中展现的数理思维。
而正如前文所提及的,在17世纪自然科学取得胜利、启蒙理性迅速扩张之后,“实证论述”也据此在当今被称作社会科学的领域生根。在此过程中,孔德接续圣西门的思想精神,成为“实证主义”的开山鼻祖。孔德毕生致力于将实证科学运用于人类实践的各个领域,而这只有依靠观察和经验获得的实证的知识才能做到。因此,孔德断言:“凡是没有把握这种知识的地方,我们的任务是要靠模仿高等自然科学所用的方法,来取得这种知识。”而在孔德所倡导的实证主义体系中,实验也被认为是除观察之外最为重要的社会学方法。实验既包括直接实验,即在专门为研究目的创造的条件下对现象变化进行观察,又包括间接实验,即研究社会中由于严重干扰而导致的病态性偏差,亦如病理学对疾病的研究理解。在孔德之后,涂尔干接过实证主义的旗帜,并成为经典社会学的代表人物。涂尔干认为,社会学方法最基本的规则是将社会事实当作物来考察,唯有如此方能像自然科学一样破除观念带来的幻影。
然而,自然主义思潮虽然盛极一时,但其朴素的理想——通过自然科学方法可以解释一切社会文化现象——并未实现,自然科学与社会科学的界限也未因此打破。在狄尔泰第一次举起反实证主义的大旗后,大量社会学家试图“回到康德”,与实证主义划清界限。其中,马克斯•韦伯在反实证主义的基本立场下建构了影响最为深远的社会学体系,展示了一种“以历史主义观点超克实证论者的自然主义的努力”。在韦伯看来,在有意义的人类行动当中,行动者的自我思考无法忽略对行动的目的和结果的权衡,从对可能付出的代价和目的之间的权衡到作出决定,并非科学力所能及的任务,而是有所欲的人的任务——个人在价值间的斟酌选择。
虽然社会学家以大量的精妙论证抵御了社会科学的本体论和认识论危机,但不可否认的是,自然科学的方法论在社会科学领域攻城略地,其影响已无法消除。在诸多影响中,实验方法的引入显得尤为重要。在20世纪,社会科学的相关研究大量运用实验方法,如研究环境和工人效率关系的“霍桑实验”、研究股民投票行为的实验等政治学实验和心理学实验。而最引人注目的当属实验方法在经济学领域取得的巨大成功。现下,实验经济学(experimental economics)已经成为经济学的重要分支,大量的理论假说也在一系列实验的严格检验后被保留下来,成为经济学的经典理论。在此过程中,实验方法为经济学带来的方法论变革在于实验不只是为经济理论提供经验基础,同时通过实验现象定位异常的理论假设进而向理论反馈,借此形成实验与理论的对话渠道。
法学本身就是一种社会科学,就法学研究而言,法学的实验方法很早就运用了概率和统计的方法。但实验方法在法学领域的真正广泛运用,有赖于20世纪二三十年代兴起的美国现实主义法学派发挥的重要作用。哈佛大学法学院首任院长兰德尔借鉴自然科学的实验方法,提出了案例教学法的新教育方法。卢埃林、弗兰克等学者以耶鲁大学法学院、哥伦比亚大学法学院等为阵地,借鉴并发展了霍姆斯的实用主义,在方法论上引入了社会科学的实证主义。法律现实主义运动相伴着“实证主义法律研究”流行,实验方法和实证方法都属于实证主义的分支,但又有所差别。实证方法是社会科学通过对研究对象大量的观察、调查和统计,从个别到一般以归纳出事物的发展规律与本质属性。而实验研究方法是借鉴自然科学检验或试验的方法,大多是通过做实验来得到某种结论,或者验证或证伪某种理论。
数字法学研究为什么要引入实验方法
数字法学实验主要聚焦立法和司法、执法领域的数字化研究,通过人工智能、大数据分析、云计算、区块链等技术赋能立法、司法和执法,提升法律运行的质效。
(一)规制对象:从传统行为到数字行为
无论何种学派的法概念,法律一定关涉到人的行为。而社会变革和人的行为模式的改变,势必影响法学理论和法学研究方法的转变。明显的是,社会的数字化转型并非仅仅发生在独立的虚拟世界或网络空间内,相反,数字社会正重新塑造着人类的行为和思维方式。正如学者所言,基于算法形成的赛博空间并非数理意义上的形式空间,更非脱离社会经验的乌托邦,而是一个基于人类认知和行动而形成的相对的、经验的、具备渗透性的空间。在这种物理空间和网络空间互相交织、互相渗透的情况下,数据成为新的生产资料,它改变了传统的生产关系,算法亦成为新的技术化的社会规则,
它影响着社会现实。
近年来,数字资产、数字人格、数字货币、数字身份、数字金融、数字作品等一系列新概念全面融入社会生活。这种“虚实同构的数字行动逻辑”不仅体现在日常生活中,更对法律实践造成了根本影响。当下,不仅网络犯罪日益技术化,随着区块链存证、大数据侦查、大数据法律监督、在线庭审、人工智能辅助量刑等逐渐被人们熟知,整个司法系统也处于信息化的进程之中。随之而来的是“从法律渊源形式到法律规范体系、法律价值标准,再到法律知识体系”均受到相当强烈的冲击。在这样的时代境况下,我们没有理由认为传统的法学研究方法可以独善其身,以先贤哲思的理论便足以诊断数字社会的疑难杂症。当然,这并不意味着传统法学的研究方法不再重要,而是强调实验方法能够作为当下数字法学研究的有益补充。
当人的行为模式中包含大量的数字行为时,更发达的信息技术为引入实验方法提供了可能性,更复杂的社会系统为引入实验方法提供了必要性。当面临复杂系统如数字空间和物理空间相互渗透的社会系统时,确定变量之间的因果关系是非常困难的,以统计方法为主要手段的实证分析,本质上是将复杂系统拟制为线性系统并从中发现趋同性现象,但仅靠人力难以发现和解释大量的主体异质性导致的多样性。因此,复杂的观察对象倒逼传统研究方法做出革新,否则根本无法揭示社会运作的复杂机理。
(二)实验条件:从难以控制到仿真环境
实验方法的本质就是研究者在妥善控制无关变量、干扰变量的情况下,观察自变量的变化对因变量所产生的影响效果,探寻两者间是否存在因果关系。但是法学实验面临的最大问题是受控实验的可能性问题。波斯纳甚至认为,正因法学无法进行受控实验,导致了法理学科学性不足的困境。事实上,难以控制并非仅是法学实验面临的问题,而是整个社会科学在尝试使用实验方法时均会遇到的问题。简单地说,一个实验是否科学可信,取决于实验的效度,实验的效度问题可能有两方面:一是“内部无效度”(internal invalidity),即实验没有准确地反映自身,实验以外的刺激因素对因变量产生了影响;二是“外部无效度”(external invalidity),即实验能否概化、推广到现实世界,能否进行可靠复制。因此,在部分学者看来,“能否有效控制干扰变量”“受试对象能否很好地代表研究对象”“实验环境能否很好地模拟现实世界的情境”以及“实验能否重复进行”构成了社会科学实验的“不可能四边形”。
但是,技术发展对研究方法带来的影响可能远超法学家的想象,数字实验能够兼顾社会科学实验的可控性与仿真性、内部效度和外部效度。例如,大量社会学家运用ABM(Agent-Based Modeling)模拟高度复杂的社会系统,并由此产出了许多重要成果。ABM是一种完全基于微观层面的个体行为的计算模型,智能体(Agent)之间能够基于行为规则进行自主交互、决策。因此,ABM是一种基于个体适应性和异质性的行动者、决策者模型,能够为研究者提供更加真实自然的模拟社会环境,并且能够用于复杂假设的检验。当下,我国也有学者基于ABM仿真进行犯罪预测、疾病传播、网络群体行为规律、市场化与社会信任的关系等方面的研究,但法学尚未关注到此种研究方法的运用。
总之,数字实验方法在一定程度上打破了传统社会实验的“不可能四边形”,不确定性也不是法学研究和实验方法之间的“天堑”。甚至有学者认为,试图检验法律的确定性、探索阻碍法律确定性的原因并为提高法律的确定性奠定和增加规律性的经验认识,唯有法学实验才是根本办法。从其他学科的表现来看,不确定性已不再是不可解决的问题,即便法学无法通过实验到达“自科法学”的状态,数字实验方法的引入也有利于增强对经验材料的探索和认识、检验法学理论和猜想。
(三)实验结论:从关联描述到解释因果
近年来,无论是定性研究还是定量研究,经验实证研究都获得了相当程度的青睐与追捧。但是,当下的经验实证也遇到了发展的瓶颈,在生产大量成果之后,其不足日渐显现。
一方面,经验数据的体量愈发庞大,分析工具的使用愈发复杂,但得出的结论不可重复,相关变量之间因果关系的判断是否可靠也无法检验。有学者指出,目前大多数社会计算驱动的社科研究,其结论本质上属于描述性或关联性而非因果关系,将此类描述性或关联性结论用于解释社会现象是不可靠的。虽然通过聚类分析、回归分析等统计学方法,法学学者能够揭示变量间可能存在的联系,但当下的实证研究并不是可供重复的研究方法,而这也阻碍了检验结论的可能。事实上,大量的分析结果印证了学者的预期,这种“直觉”驱动的变量分析得出的结论是否真的可靠,不同变量之间是否真的存在因果关系,唯一的方法就是验证。
另一方面,研究视野宽泛却缺乏宏大集中的问题意识,难以和法学理论形成紧密衔接和沟通。由于问题意识的散乱,当下的实证法学被部分学者形容为“经验数据或田野故事包装出来的、千篇一律的学术工业品。”在这种情况下,相关的实证研究呈现出“两张皮”的现象,法学理论和基于经验证据得出的结论之间无法产生真实对话。而这也导致此类研究不具有生命力和可持续性,经验材料的区隔使得相关结论既无法与其他实证研究互相印证,也无法和既有的理论形成互动,转而成为描绘某一特定事实现象的数据游戏。
从结果的可靠性、可解释性和可重复性来看,实验方法具有传统实证难以企及的优势。虽然利用统计方法,研究者已经具有探析因果关系的能力,但这些传统的技术和方法在控制无关变量和确定变量时序等方面远远不及实验方法。在司法大数据的规律挖掘、类案推送等方面,传统统计工具也无法和神经网络、深度学习等技术相媲美。相比较而言,实验方法能够弥补当下实证分析的不足,通过可复制性增强经验研究的生命力,并通过对理论假说和具体问题的证实或证否,搭建起规范和实证、理论和经验沟通对话的桥梁。
数字法学实验研究如何展开
(一)前提:数字法治学术共同体的建构与发展
数字法学实验研究具有较高的学术门槛,其成功的前提在于打破大量学科间的壁垒。创建了哈佛定量社会科学研究院的加里•金(Gary King)教授认为,在建设此类研究中心的种种要素中,被公认的最为重要的成功因素是学术共同体:“无论是哪种原因,学术共同体的质量是根本性、关键性的原因。”数字法治实验研究的基础同样是数字法治学术共同体的建构,具体包括以下两个方面。
一方面,应当加强数字法治人才培养。“懂技术的不懂法律,懂法律的不懂技术”是当下数字法学研究面临的重大问题。无论是法学理论还是信息技术,本身都需要系统的训练才能有效运用于实践。这种学科壁垒使得双方无法理解对方的学术话语体系,不仅使具体研究难以深入,甚至会引起概念上的误解,导致“貌合神离”,必不可能产生理想的学术影响和成果质量。因此,有必要重构数字法治人才培养模式,在既有的培养方案上进行调整。需要说明的是,主张加强数字法治人才的培养,并非认为数字法治人才应当兼顾信息技术和法学理论知识同步的深入学习,这在事实上不太可能。正如前文所言,培养数字法治人才的目的不在于使其一肩担负两职,而在于为形成数字法治共同体提供条件、为不同学科之间的合作提供基础。因此,数字法治人才的培养重心仍在于法学基础知识的培养、法律思维的训练,同时通过特色的课程设计使其具备一定的数学知识和计算机知识。
另一方面,应当建设数字法治实验室。当下,零散的跨学科合作已无法适应时代的需求,更无法保证产出的质量。数字法治实验室不仅仅是组织结构上的调整,更代表学科的融合、思维模式的转变。“文科实验室以一种开放的面向将不同主体的实践网络在同一场域内搭建起来,使得异质性要素的特征和力量都能够得到充分的展示,为知识生产提供了一种全新的认识论意义上的思维模式。”可以说,数字法治实验室的建立是因应数字时代观察对象复杂性的必然之路。
总之,无论是人才培养模式的创新还是合作形式上的转变,二者都是数字法治学术共同体建构的前提要素,缺一不可。
(二)基础:标准化的数据标注和法学知识图谱
数字法学实验与传统经验实证的重要不同在于其更高的标准化和科学性,而这显著依赖于数字法学的知识图谱构建。知识图谱也被称为“知识域可视化”,是对相关的信息、技术知识及其内在关系进行分析、挖掘并可视化后得到的结果,包含着一系列可视化分析方法和工具的应用。在数字法学领域,构建数字法学知识图谱也是展开法学研究的首要前提,即针对具体的应用场景及相关的可量化问题,将法学知识、法律规则和司法数据图谱化,在此基础上进行算法训练并将其运用于判决预测、辅助量刑等司法实践之中。
在构建知识图谱的过程中,数据标注发挥了核心作用。一般而言,数据标注指的是对未经过处理的数据如文本、语音、图片、视频等进行加工,使其转化为机器可识别的数据。无疑,数据标注越精准、数据标注体量越大,知识图谱构建才越具有体系性和统一性,相关算法的性能及准确度也越高。而从当下司法信息化的实践来看,数据标注的颗粒度不足、考虑的案件因素不够全面等成为法律人工智能的预测效果不佳的重要原因。因此,如何高效、准确、科学地将司法数据、法学知识引入数据驱动机器学习,面向实践需求建立可解释性更强的司法知识计算引擎,实现基于概念、语义、主题等结构化知识的推理和决策平台,是当下数字法学实验需要解决的核心难题。
一方面,在确保数据体量的同时,提升数据质量。大体量的原始数据势必具有杂乱性、模糊性、重复性、缺失性等问题。因此,相关实验需要首先制定清洗规则,降低噪声数据、缺失数据和不完整数据带来的影响。在对清洗后的数据进行标注时,为兼顾效率和准确性的要求,数据标注应以自动标注为主,人工标注为辅,并尝试开发结合人力与机器独特优势的众包数据标注标准和平台。如此一来,在自动标注大幅提升标注效率的同时,人工标注可以纠正自动化处理的偏差,确保数据标注质量。
另一方面,建立标准化的司法数据集开发数据仓库。数据仓库是将不同的数据源或数据库进行加工后形成的“主题的、集成的、非易失的和随时间变化的数据集合”。当下,大量的裁判文书为司法数据挖掘提供了可能,许多法院也借此建立了相关的案情数据库。但是,这些偏向零散的司法数据集可能存在数据标准不一致、算法偏向简单归纳、要素提取不够细致等问题。建立具有一定规模的数据仓库,能够将原始的司法数据集转化为标准化的司法数据集,在此基础上使用神经网络、深度学习等技术,实现数据驱动的法律知识图谱构建。
总之,面向数字法治典型场景构建科学的法学知识图谱,是数字法学实验得以展开的基础。法学知识图谱以数字化的方式实现法律规定、法学理论和司法实践在具体场景下的互动连接,并在此基础上展开后续的分析、验证、预测工作。
(三)核心:数据建模和虚拟仿真系统建设
数字法学实验方法与传统实证方法的重要不同在于,通过数据建模在虚拟仿真系统中进行实验,数字法学实验能够实现对未来的预测。“早期的大数据分析基于短期实用的目的,其研究策略是把收集到的数据当母体,以描述性统计和相关分析为主,或拟合一些既有的模型,这样的数据挖掘出来的预测因子及行为模式推论能力有限。”而随着主体建模、机器学习、神经网络等方法技术的创新发展,以可验证的方式预测法律效果成为可能。
数字法学实验方法应当包含以下五个步骤。第一,应当基于学说争议、制度规范和实践经验提出理论假设。在具体的实验操作之前,提出一个理论、规范与实践相结合的“真问题”,是避免其成为“工业流水线上的复制品”的关键所在。第二,根据司法应用场景,制订实验方案。实验方案应当充分考虑数字实验的可行性,给自变量和因变量以操作化定义。第三,通过数据建模,利用虚拟仿真实验技术搭建实验环境。在此过程中,要充分考虑异质主体的不确定性问题,尽可能地模拟真实的社会环境。第四,进行仿真实验,操纵自变量并观察因变量。通过设置没有施以刺激的对照组,发现不同干预措施的效果。第五,验证或预测理论假说。例如,在数字法治场景的主要应用地如法院、检察院和其他司法行政机关开展试点试验,采用实地评估、试点绩效评估等机制综合评价试点效果。
(四)内容:数字法学实验可以包括什么
在数字法学实验环境下,可以探索并不限于以下的实验内容。
搭建数字法治虚拟仿真系统,以数字化和虚拟化的方式呈现司法、执法和法律服务的各种应用场景。建立一整套技术标准,实现事先规范司法、执法等全流程各个阶段的数据格式整合目标,探索建设数据标注和清洗的统一平台。研发具有实体识别能力的案件管理系统,具备对重要法律文书的自动解析能力,输入法律文书文本后,自动生成结构化的数据表单。建立统一的数据处理和标注标准,开发可以广泛适用于司法、执法等过程的数据整合平台。
测试统一的法律推理知识图谱开发、维护和更新平台。导入海量数字法治数据,建立数据仓库与知识中心,是数据驱动与知识引导结合的前提。针对热点民生案件、生态环保案件、涉外民商事案件、金融犯罪等特定类型案件,研究案件的证据认定标准,建立全案由要素知识图谱。借助请求权基础的分类方式,建设完成法律推理知识图谱范式,从数据中挖掘学习,同时引入专家知识,建设开放性知识图谱开发平台。
开发立法智能化审查系统,比对和分析法律条文,审查法律条文的合宪性与合法性。运用语义理解、实体/关系识别技术,对部分规范性文件进行实时审查、动态审查、追溯审查。构建大规模法律法规知识图谱和表示学习技术,构建基于图谱逻辑规则和推理的立法条文比对技术,基于大规模知识图谱构建合法性和合宪性审查技术。
以司法裁判主要的任务设置实验目标,包括但不限于罪名预测、量刑预测、法条推送、赔偿金额预测、法院观点生成等任务,借助实验室具备的司法大数据进行实验研究,尝试引入领域知识以提升司法模型预测的性能,提高模型的可解释性。构造一个大数据驱动和知识引导的司法智能辅助系统,该系统应基本具备辅助立案、审判和执行的功能,实现对电子证据的区块链存证和对证据三性的智能化验证,在类案检索、电子卷宗深度挖掘、刑期预测、裁判文书自动化生成等任务上有良好的实验结果,并具备较强的应用示范能力。
模拟数字法治场景下的信息化多元协同、智能化会商研判、智能化民主协商机制。研究基层社会治理事件分级分类标准规范、智能分拨和平台设计等。完成基层社会治理与法治事件的关键问题抽取技术、事件相似度匹配技术、事件智能调度技术、多部门关系挖掘技术等关键技术研究。完成数字法治场景下的信息化多元协同、智能化会商研判、智能化民主协商系统模型。研究社会治理与法治要素提取模型、事件分析模型、事件—处置方案数据库、部门间事件协同处置网络模型、多维度事件考核评估模型等,实验基层社会治理与法治事件分拨与全周期管理平台。
打造大数据中台、算法中台、业务中台,融合及打通基于全链路大数据技术的数据治理方法,构建法律服务一体化中台技术,分析及构建数字法治协同中台数据资源模型,构建具有共性协同支撑能力与共治共用的数字法治中台。探索基层服务一体化中台技术研究,模拟数字法治大数据处理模块、数据资源模型和业务模型的集成,实现统一门户、人员、事件等态势展示、信息交互、服务推送、统一信息填报、风险发现、事件处置等共性业务构建。形成以模块为最小服务单元的分布式微服务协同治理的一体化知识图谱服务应用平台,测试具备共性协同支撑、共治共用的数字法治中台。
数字法学实验研究的风险防控
在数字时代,数字法学研究方法有其他研究方法无法企及的优势,但同时该方法也有其与生俱来的风险。
第一,数字法学实验方法具有数据安全风险。无论是提炼经验、挖掘规律,还是预测法律效果,数字法学实验方法都离不开对大数据的分析应用。此外,大数据具有典型的多样性特征,不仅包括大量的隐私数据,同样包括金融数据和医疗数据等关涉社会稳定和国家安全的数据。因此,数据安全风险是数字法学实验方法的风险来源之一,也是防控对象的重中之重。在建设司法数据集、数据仓库时,应当分别针对结构化数据、半结构化数据和非结构化数据进行安全管理,采用数据加密技术确保数据的存储安全和传输安全。在数据使用中,要完善使用的规范流程,对相关操作进行留痕处理。同时,数字法学实验室还需要着力建立防火墙以应对外部攻击。
第二,数字法学实验方法具有伦理风险。“几乎所有的社会科学实验,都包含着欺骗。”对受试者隐瞒实验情况,是为了保证受试者不会因提前了解实验目的而改变自身行为的必要手段。除了“欺骗性”以外,带有“侵略性”的实验也会给受试者带来困扰乃至伤害,进而使人质疑此类研究的合法性与正当性。因此,数字法学实验应当确保实验的安全性和合法性,同时平衡研究价值及可能造成的不利后果。在实验研究过程中,不仅要切实维护受试者的隐私权,更要“在推理和计算中贯彻以人为本的精神”,慎重对待生命伦理。
第三,数字法学实验方法具有形式主义风险。“研究者一旦过度热衷于追求数据化、公理化、精确化,乱象丛生的错误被形式的完美掩盖。”研究者应当从三个方面入手,避免数字法学实验方法出现技术崇拜、过度追求形式逻辑的风险:一是强化技术的透明性和实验的可复制性,借此获得可供学者对话、检验的结论;二是警惕其他方法论的缺失,实验并非要独立开创一块不毛之地,而是要与其他法学研究方法互相配合,拓宽当下法学研究的视域;三是重视人的主体能动性,避免“客体化”的逻辑以及科学方法和程序进而被“对象化”,倒反过来支配着人自身的不良倾向。
第四,数字法学实验方法所得出结果的可靠性存疑。从逻辑推理的类型来看,这种推理是假说推理,是不保真的推理类型,其实验结果是容易受到质疑的,最直接的体现就是目前实验方法得到判决预测、刑期预测等模型在实践中应用的适用性较弱,就是因为实验的结果与真实的应用可能是不相匹配的。如智慧司法实验的可靠性便是有限的。“尽管算法决策是基于客观的数据分析和理性计算作出的,但面对重大疑难案件和大国的司法运行,有很多复杂因素难以用建模算法来回应。即使可以进行量化计算,也可能达不到人们所期待的精准程度。”这便要求我们对数字法学实验结果持谨慎态度,不能想当然地将实验等同于实践,需要探索在实验与实践之间搭建桥梁。
此外,数字法学实验方法还存在被滥用的风险。一方面,数字法学如果言必称实验则容易误导大众;另一方面,实验结果自身有欺骗性,有的实验结果不能复制,甚至有的学者自己编造实验结果。
总之,数字法学实验方法既要从数字技术的应用中寻求法学的科学化,又要在种种价值中平衡取舍,努力避免滑向一端而导致的种种风险。唯有如此,数字法学实验方法才能够有效助力作为科学的法学,成为具有长久生命力的法学研究方法。
结 语
就信息技术对法学造成的巨大影响而言,无论学者观点如何,能够确定的是人类社会再也无法回到数字时代之前。当下,我们再次强调法学的科学性、提倡法学研究中的实验方法,不是重申法学与自然科学别无二致的复古观点,亦非主张实验方法是法学研究方法的“王牌”,而是将其定位为一种顺应时代发展、提升数字法学研究能力的重要方法。从信息技术在社会科学所展现的巨大潜力来看,仅以法律系统中的不确定性为由,认为人脑比技术更具分析优势进而拒斥实验方法的观点可能需要转变。有理由相信,随着信息技术的进一步发展,数字法学实验方法具有广阔前景,并可能开启以往学者从未窥见的数字法学之门。
原文刊载于《华东政法大学学报》2023年第1期