熊明辉|法律人工智能的推理建模路径(法律人工智能编写指南)
本文原载《求是学刊》2020年第6期,此处为了方便阅读省去了注释部分,引证请使用原文https://mp.weixin.qq.com/s/7C4AIybJ9zaMqgVrcnhkrw。
摘要:法律人工智能的核心问题是自动法律推理建模。文献表明,推理建模有两种经典路径:一是规则推理建模路径;二是案例推理建模路径。虽然二者分别源自欧洲大陆法传统和美国判例法传统,但事实上无论是在大陆法系还是在判例法系,规则推理建模都是最根本的路径,案例推理路径是作为规则推理建模的补充路径出现的。法律推理建模以自然语言处理为前提,这一人工智能难题决定了法律推理建模的天然难度。大数据驱动催生了法律推理建模的第三种路径——大数据推理建模路径,而且这种路径可以用来弥补前两种路径的不足,虽然这种路径仍处于探索阶段,但已有了一些落地法律应用软件,如我国的智慧法院工程以及美国的法律应用软件Lex Machina和Ravel等。
关键词:法律人工智能;自动法律推理;规则推理;案例推理;大数据推理
作者简介:熊明辉,中山大学逻辑与认知研究所和哲学系教授、博士生导师(广州 510275)
基金项目:2018年度国家社科基金重大项目“新兴学科视野中的法律逻辑及其拓展研究”(18ZDA034)。
一、 何谓法律人工智能
“法律人工智能”是法律信息学的主要研究对象。作为一个术语,它源自英文术语“Artificial Intelligence and Law”,其直译应当是“人工智能与法”,属于人工智能与法学的一个交叉研究领域,探讨的是人工智能在法律中的应用,因此,我们在此将其译为“法律人工智能”。2019年,维基百科全书英文版将原来的“法律人工智能”(Artificial Intelligence and Law)词条正式更名为“法律信息学”(Legal Informatics),这意味着,法律人工智能不再是一个学科名称,而将作为法律信息学的研究对象而存在,就学科而言,法律人工智能研究被归入法律信息学范畴。所谓法律信息学,根据艾德里兹和奥黑尔的观点,是指信息科学在法律语境中的应用,其中涉及与法律有关的组织机构,如律师事务所、法院和法学院,以及这些组织内部的信息与信息技术用户。
法律人工智能首先是人工智能的一个子领域。根据里士兰、阿什利和路易2003年在《人工智能》杂志上发表的《法律人工智能:一个富有成效的协同创新》一文中所持观点,“法律人工智能”是人工智能研究的一个经典领域,提出了一系列很有趣的人工智能难题,探讨的是人工智能在法律中的应用。根据通常的看法,如果从1987年美国东北大学召开第一届法律人工智能国际会议、法律人工智能学术共同体正式形成开始算起,那么法律人工智能有三十多年的历史。但法律人工智能的核心问题是法律推理的逻辑表示问题,如果从关注“自动法律推理”这一议题开始算起的话,那么至少可以追溯到六十余年之前,在英国国家物理实验室1958年举办的“思维过程机械化论坛”上,梅尔发表了《法律世界的自动化:从法律信息机器处理到法律机器》一文,在这篇具有里程碑意义的文章中,梅尔提出了要用逻辑进行法律信息检索与推理。
然而,如果仅从自动法律推理实现方案来讲,1970年美国匹兹堡大学计算机科学系教授布坎南(Bruce G. Buchanan)与美国巴法罗大学法学院教授海德里克(Thomas E. Headrick)在《斯坦福法律评论》上发表的《关于法律人工智能与法律推理的几点思考》则被视为首个真正的法律人工智能提案,因为他们第一次正式把“人工智能”与“法律推理”关联起来思考问题。正因如此,有学者在谈及法律人工智能的历史时往往从1970年布坎南和海德里克公开发表的那篇论文开始。如张保生认为,“1970年布坎南和海德里克发表了《关于人工智能和法律推理若干思考》一文,揭开了对法律推理进行人工智能研究的序幕。”
不过,要想真正把握法律人工智能的核心,首先必须弄清其上位概念“人工智能”的核心问题所在。人工智能的核心问题是用计算机实现自动推理。1950年图灵(Alan M. Turing, 1912-1954)提出了“机器会思维吗”这一著名的哲学问题。在他看来,要回答机器是否会思维很难,但我们可以用另一个密切相关的问题来代替这个问题,为此,他设计了一个称之为“模仿游戏”(the Imitation Game)的思想实验。“模仿游戏”是一个三人游戏,由一位男性(A)、一位女性(B)和一位或男或女的询问者(C)组成。询问者待在与A和B不同的房间,其目标是要确定他们两个人的性别。询问者通过标记X(女)和Y(男)来识别他们,在游戏的最后,他将判断“X是A,Y是B”或者“X是B,Y是A ”。在游戏中,询问者可以向A和B提问,如“请告诉我你的头发有多长”。在游戏中,A的目标是要让C的识别出错,故他的回答可能是:“我的头发是带状的,最长的一束有九英寸。”为了使询问者不受语音音调等因素的影响,答案应该手写,最好是打字。理想的安排是让电传打印机。当然,也可以由中间人复述问答方式进行。B的游戏目标是给询问者提供帮助。对她来说,最好的策略可能是给出真实的答案,比如,“我是女人,不要相信他的话”,但她的回答可能无济于事,因为A也可以这样回答。现在我们思考一个问题:“在游戏中,如果我们用机器代替A时会怎样?”在同样的游戏中,询问者会像与人类游戏过程中一样经常做出错误的判断吗?这些问题取代了“机器会思考吗” 这一原来的问题。通俗的说就是,当一个人与某个智能体进行交流时,竟然可能无法识别他是否只是一台机器。
这种测试机器是否会思维的方法如今被称为“图灵测试”(the Turing Test),通常被认为是人工智能的第一个哲学方案。但在冈德森(Keith Gunderson )看来,其实笛卡尔早在1668年就提出了类似图灵测试的想法。在笛卡尔看来,即便存在与我们身体相似的机器,并且为了所有实践目的尽可能地模仿我们的行为,我们仍然应该有两种非常确定的方式识别出它们:首先,它们无法像我们一样为了向他人传达自己的想法而使用语词与符号。我们肯定能够设想一台机器能够发出的声音,甚至发出与引起人体器官变化的身体动作相对应的声音。……但我们无法想象这种机器哪怕像最愚蠢的人那样,能够产生不同的语词排列方式,对在场的讲话给出适当的、有意义的答案。其次,即使某些机器可能会像我们一样完成某些事情,甚至做得更好,但它们不可避免地会在其他机器上却做不到,这表明它们的行为不是出于理解,而仅仅是出于其装置的处置。尽管理性是一种可用于各种情况的通用工具,但理性需要人体器官采取某些特殊行动。因此,机器实际上不可能拥有足够多的不同类似人体器官的装置,保证其能够以人类理性行事的方式在各种生活偶然事件中行事。笛卡尔对机器是否会思维显然秉持否定态度,而且图灵也只是提出一种检验机器是否会思维的方法,并没有给出明确答案。当然,这也意味着,图灵对机器是否会思维并没有持否定态度。
假如图灵的“机器会思维吗”问题成立,那么人工智能的核心事实上可归结为“机器会推理吗”这一问题。根据弗雷格的定义,逻辑学是关于思维和推理的科学。根据传统逻辑学家的共识,思维形式通常包括概念、判断和推理三类,或者说,词项、命题和推理三类。在逻辑学家看来,推理才是思维形式的核心概念,从弗雷格的逻辑学定义也可以明确看到这一点。于是,“机器是否会思维问题”就转变成了“机器是否会自动推理问题”。可见,自动推理的实现问题便是人工智能的核心问题。相应地,法律人工智能的核心问题就是自动法律推理的实现问题。从法律人工智能发展史来看,法律人工智能领域中自动法律推理建模有两种经典路径:一是规则推理路径;二是案例推理路径。然而,大数据时代的到来却催生了第三种推理建模路径,即大数据推理建模路径。不过,这一路径目前尚处于形成之中。
二、 规则推理建模路径
在法律人工智能中,规则推理建模的本质上就是将法条表达为机器可理解的法律知识库,供自动法律推理引擎随时调用。毫无疑问,对于成文法系来讲,这应当是一种主流建模路径。《法律人工智能杂志》主编阿什利(Kevin Ashley)认为,法律首先是一个规则领域,许多法律规则体现在法律与法规中。既然规则可以从逻辑上进行表达,而计算机可以执行演绎推理,那么,从计算上建模成文法推理应该很容易。只需向计算机程序输入一个事实情节,程序就会识别相关规则,判定规则的条件是否得以满足,并根据规则提供解释或给出答案。然而,建构法律成文法律推理的计算模型却遇到了严峻的挑战,因为通常情况下成文法是模糊的,在语义和语法上是含混的,受制于结构上的不确定性。假如某个计算机程序要应用一个法条,那么它应该应用哪种逻辑解释,如何处理法律术语的含糊性和模糊性,或者如何判定是否有例外呢?这些都是规则推理必然要面临的挑战。
尽管如此,法律人工智能研究首先还是从规则推理进路开始的。该进路有两项早期贡献:一是1981年兰德公司民事司法中心沃特曼(Donald Waterman)和彼得森(Mark Peterson)建立的一个专家系统,用于解决侵权法中产品责任案件的法律裁定,该系统是规则推理建模路径的第一个尝试。二是1986年伦敦帝国理工学院的塞科特等人用逻辑编程来建模《英国国籍法》的某些部分,建立了一个庞大的独立法条体系。此外,在该进路中,特别值得关注的是,斯坦福大学计算机学院加德纳1984年的博士论文。这是法律人工智能领域的第一篇博士论文,加德纳系统地给出了规则推理建模路径,其关注的问题是“当规则运行”时会发生什么,也就是,当规则前件使用了一个未用其他规则定义的谓词时,特别是涉及语词专业含义与常识含义之间关系的法律概念与问题所固有的开放结构时,会发生什么。《法律人工智能》(Artificial Intelligence and Law)杂志创办者伯曼(Donald Berman, 1935-1997)在1985-1989年期间关注的焦点就是规则推理建模路径。他提出了一个分类路径,并解释了为什么需要每种系统及其之间的区别,这些系统包括预测系统、规范系统等。
规则推理(rule-based reasoning),直译应为“基于规则的推理”,是法律推理的最重要类型。在规则推理中,我们会接受某条规则并将其应用于一组法律事实,而且这种推理通常被认为是演绎的,也就是说,只要所有前提均真,就必然推导出其结论也为真。其中,规则可是法条,也可以是既有案例。在纽曼看来,每条规则都可能包含四个要件:(1)一组被统称为“检测”的要素;(2)所有要素都出现并满足了检测时的结果;(3)一个用来判定结果是属于强制性的、禁止性的、任意性的还是陈述性的因果术语;(4)一个或一个以上的例外,即:即便所有要素均得以满足,结论仍然会被击败。其中,前三个要件相互独立,且对于每条规则来讲都是必不可少的,而只有部分规则会涉及第四个要件。例如,如果被告的行为是蛮横、故意的而且导致了原告严重的精神痛苦,即成立故意精神损害。如果本案事实满足了规则的所有要素,那么该规则得以满足。比如,某男给前女友深夜打了好几次电话骚扰她(即蛮横的故意行为),而且这导致她遭受了严重情感伤害,那么就成立故意情感伤害了。
规则即做出裁定的公式。法律人工智能建模的首要工作就是法律知识表示,即将法条和案例知识表示为可计算的法律知识库,为自动法律推理提供基础法律知识库。纽曼区分了四种类型的规则:(1)强制性规则,亦称“义务性规则”,主要涉及“应当”型或“必须”型法条,如“犯罪嫌疑人、被告人因经济困难或者其他原因没有委托辩护人的,本人及其近亲属可以向法律援助机构提出申请。对符合法律援助条件的,法律援助机构应当指派律师为其提供辩护。”(2)禁止性规则,主要涉及“禁止”型或“不得”型法条,如“侦查实验,禁止一切足以造成危险、侮辱人格或者有伤风化的行为。”(3)任意性规则,亦可称“自由裁量规则”,主要涉及“可以”型或“有权”型法条,如“审判未成年人刑事案件,未成年被告人最后陈述后,其法定代理人可以进行补充陈述。”(4)陈述性规则,主要涉及“是”型法条,即不带模态词的法条,如“明知自己的行为会发生危害社会的结果,并且希望或者放任这种结果发生,因而构成犯罪的,是故意犯罪。” “因果术语”是规则的核心要件,它是区分强制性、禁止性、任意性和陈述性规则的标志。强制性规则是要求某人做某事,其因果术语标识词常常是“必须”或“应当”;禁止性规则是强制性规则的对立面,规定的是禁止某人做某事,其因果术语标识词是“不应当”“不得”“不许”等;任意性规则是赋予某人做某事的权力,被授权者做某事拥有自由裁量权,绝非非做不可,其因果术语标识词常常是“可以”或“有权”;陈述性规则只是陈述了某事为真,似乎不太像规则,但我们已经熟悉了陈述规则及其后果,其因果术语标识就是没有模态词,这种规则就是用实然语句来表达的。早期,纽曼只区分了前三种规则类型,后来才增加了第四种类型。事实上,某条具体规则到底属于哪种类型,有时未必显而易见,因为有些规则初看起来属于某一类,但仔细审视之后却发现它竟然属于另一类。
一方面,规则可以是前向链接(forward-chaining),又称为数据驱动推理(data-driven reasoning),因为它们从数据或事实开始,寻找适用于事实的规则,直到达到目标。另一方面,规则也可以是反向链接的,又称为目标驱动推理,因为它们从一个目标开始,寻找适用于该目标的规则,直到得出结论。然而,规则只是一种模式,推理引擎在与数据模式匹配的规则中搜索模式。推理引擎是指在给定情形事实基础上处理规则、案例、对象或其他类型的知识和专业知识的软件代码。大多数人工智能工具都包含着某种推理能力,而且这种推理能力不限于演绎推理能力,还可能是非演绎推理能力,后文中案例推理建模路径就与非演绎推理能力有关。
从推理建模角度来看,规则的一般表达形式是“如果……,除……以外,……,否则……”。“如果”表示“当条件为真时”,“那么”表示“采取行动A”,“否则”表示“当条件不为真时,采取行动B”。比如,如果(1)确实发生了抢劫行为;(2)嫌犯身份证明真实;(3)物证真实;且(4)嫌犯没有不在场证明,那么,我们有理由相信嫌犯实施了抢劫行为,否则,就应围捕其他嫌犯。就法律推理建模而言,法律知识表示就是根据前述构成要件将法条与案件表示为“如果……,除……以外,否则……”表示形式,以供推理引擎调用。基于纽曼的观点,这一建模过程大致包括如下“三步曲”:
第一步,将规则拆分成构成要件。具体做法是:首先,列出测评中所需的所有要素,这些要素是规则运算中出现的元素,并对其编号。其次,识别因果术语和结果。第三,如果存在例外,还需要识别例外,如果例外不止一个,那就将它们全部列出并编号。例外亦有其要素,即是指在例外的规则运算中必须的元素。需要注意的是,在这一步骤我们无需在意语词的含义,只要把握规则的结构即可,也就是只要将其拆分细化到足以理解第二步即可。以《中华人民共和国刑法》第六条为例:“凡在中华人民共和国领域内犯罪的,除法律有特别规定的以外,都适用本法。”首先,要素为“犯罪”和“在中华人民共和国内”;其次,因果术语为“必须”(根据我国立法语言习惯,这儿的“应当”“必须”之类的因果术语常常省略);第三,结果是“适用本法”;第四,例外是“法律有特别规定的”。
第二步,独立审视那些具体的构成要素。在这一步要厘清每个要素、因果术语、结果以及例外的意义。根据法律辞典以及其他相关材料界定每个语词的含义,生成一个面向法律推理引擎的法律辞典数据库。如果现行法律对语词有明确规定,首先必须使用现行法律中的定义,比如,关于商业秘密的定义,《中华人民共和国反不正当竞争法》第九条第四款规定:“本法所称的商业秘密,是指不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息、经营信息等商业信息。”《中华人民共和国刑法》第二百一十九条第三款规定:“本条所称商业秘密,是指不为公众所知悉,能为权利人带来经济利益,具有实用性并经权利人采取保密措施的技术信息和经营信息。”必须相应按经济法或刑法的规定判别其意义。当然,这些语词若无现存数据库供调用,也需要定义。
第三步,将规则按有助于推理引擎调用的方式重新整合在一起。有时,需要按照“如果……,除……以外,否则……”形式重新排列意义,使其能被推理引擎所理解。对于许多规则来讲,它们发挥作用的内在逻辑是:(1)何种事件或情形让规则变得可运算?这些事件或情形都是需要检测的要素;(2)当所有要素均出现时会发生什么法律后果?这是因果术语和结果告诉我们的;(3)如果所有要素均出现,是否一定会发生相应的法律后果?也就是说,假如规则存在例外,则要将例外规定计算在内。通常的做法是,把规则重新整合在一起,形成一个流程图,排除某些假定事实,审视规则发挥作用的机制。从本质上讲,流程图就是一个问题清单。从第一步开始我们就可以绘制流程图,因为第一步的早期已经做了图解。图解不仅是要将规则进行分解,使得它能够被机器理解,而且要允许将规则重新整合在一起,使其易于应用。
回到前文的例子,现在假设讨论是否应当适用我国刑法追究某甲刑事责任的问题,那首先就要涉及如下两个要素问题:(1)某甲是否实施了犯罪行为?(2)某甲的犯罪行为是否在中华人民共和国范围内实施?假如两个问题的答案均为“是”,那么,应当适用我国刑法。其次,还要涉及例外问题,即“是否有证据表明某甲的行为属于法律有特别规定的情形”?例如,某甲是否享有外交特权和豁免权的外国人?如果例外问题的答案为“否”,那么,应当适用我国刑法追究某甲的刑事责任(一种结果)。
三、 案例推理建模路径
法律推理本质上是一种语用推理,这种推理可靠性评价具有很强的语境敏感性,也就是,不仅要关注其语义和语形维度,还要特别关注其语用维度,如语境要素。它之所以语境敏感,是因为有些法条包含了具有开放结构的术语和概念。这种开放结构具体表现为语义的含混性和模糊性。根据艾伦和恩格霍姆的定义,语义含混性,又可称为语义歧义性,是指涉及一个术语意义的两个明显不同选择之间的不确定性;语义模糊性是指一种涉及术语是指什么和不是指什么的精确边界的不确定性。事实上,含混性、模糊性、歧义性等是自然语言的本质特征,或者说,语义的含混性、模糊性和歧义性是对人类、社会和政治现实的让步。立法者无法设计出足够详细的语言来预测它希望规制的所有可能情形。恰恰相反,在成文法规则中,立法者使用更一般的术语,并依靠司法机关在新的事实情形下解释并应用抽象的术语和概念。因此,要想把握这些法律术语和概念,可以借助案例推理——一种基于先例的语用法律推理。
事实上,伴随规则推理建模进路,二十世纪八十年代就已经出现了另一种专注于用案例和类比进行推理的研究进路——案例推理进路。案例推理,又称“基于案例的推理”,源自英文术语“case-based reasoning”。 案件推理建模揭示了如何表达法律案例,使得计算机程序(即推理引擎)能够就它们是否与待判决的案件类似进行推理。阿什利认为,这种建模路径是建立在三种方法基础之上的:首先,原型与变异方法,一种基于既往的案例来构建理论并决定的方法;其次,维度与法律因素方法,一种采用常规事实模式来加强或削弱一方关于法律主张或概念的论证的方法;第三,范例解释法,一种根据之前法庭解释“为何适用或不适用法律概念”的方法。
1984年,里士兰和她的学生阿什利首次报告了海波(HYPO)法律论证项目及其维度机制。这项研究源自里士兰早期在基于实例的推理以及数学中的“约束示例生成”方面的工作。海波系统最初关注的是生成假设问题,因此得名,后来阿什利在其博士论文中充分发展一个案例论证程序,成为法律人工智能第一个真正的案例推理系统——海波系统,一个用于帮助诉讼代理人评估美国商业机密法纠纷的计算机程序。在本奇卡鹏看来,自1987年里士兰和阿什利在第一届法律人工智能国际会议上报告以来,海波系统无疑是最有影响的法律人工智能项目,其中,制定了法律案例推理的议程,为法律案例、针对案例推理的规则推理路径以及先例推理的形式化进行了辩护。
海波系统有如下两大特征:首先,它是一个案例推理程序。海波系统利用数据库中的真实案例来分析纠纷问题。给定一个纠纷描述,程序会把问题与相关案例进行比较,挑选出最相似的案例,并在论证中引证它;在问题与先例之间进行简单事实类比,区分先例,引用反例和问题的假设性变体,以帮助诉讼代理人能够聚焦于补强或削弱论证的其他事实。总之,海波系统会将具体的问题情形与案例库中的案例进行系统地比较与对比,找出最相似的案例。也就是我国法律人工智能界常说的“类案推送”。其次,海波系统还是一个对抗性推理器。针对如何裁判新问题,它会提出竞争性论证。换句话说,其任务不是就应当如何裁判提出一个“正确”答案,而是提供竞争性合理答案,为各方提供最佳案例,并针对那些论证进行回应。
海波系统有八大关键要素:(1)案例知识库,一个结构化的真实案例数据库;(2)维度索引,一种使用维度从案件知识库中检索相关判例的索引路径;(3)维度分析,即分析当前事实问题以及从案件知识库中检索相关案例的方法;(4)案例定位,即将问题情形相对于案例知识库中的相关判例进行定位并找到最恰当判例的方法;(5)标杆案件比较,即对案件进行比照与对比以引证、区别或发现反例;(6)提出假设,即打乱当前事实情况以生成用以检验论证强度的假设并凸显具有破坏性的新事实而抹黑既有有利事实的方法;(7)三层论证,即生成用于试运行和调试法律论证并以律师熟悉的方式使用引证标签来描述现有判例强度的三层论证的方法;(8)解释说明,通过引用先例来解释决定及其选择的框架,其中,用三层论证来对先例强度进行批判性比较,并提出对当前事实情形和先例假设变体来证明“若有不同,则会导致不同结论”的关键特征。
海波系统的推理过程涉及八个基本步骤:(1)从维度上分析当前事实情形;(2)从案例知识库中检索相关先例;(3)将当前事实情形相对于检索到的案件进行定位;(4)比较案件并挑选最佳先例;(5)针对引用先例的当前事实情形生成三层论证;(6)启发性或假设性修改当前事实情形;(7)生成所选假设的三层论证;(8)通过展示和比较论证来解释当前事实情形以及所选假设。海波系统的主要输入内容是描述法律纠纷的问题情形。诉讼代理人或助手通过计算机录入问题情形描述。由于海波系统不具备理解自然语言的能力,用户必须使用专门设计的语言来录入表达法律纠纷的问题情形。程序会有一个菜单驱动环境来引导录入过程。海波系统的主要输出内容为:各方可引用的最佳案例概要,引用各方最佳案例并展示代表对方如何回应的论证,以及表明如何修改问题情形以补强或削弱某方论证的假设。
根据本奇卡鹏的总结,海波系统的最重要思想是两个概念:一是维度(dimension)概念,即案件适用或不适用的方方面面。若适用,那么维度代表一个表达价值范围的向量,其中一端完全支持起方,而另一端完全支持应方,在某一点上维度将不再支持起方而开始支持应方。假如有n个维度,我们有一个n维空间,在某些地方支持起方而在另外一些地方支持应方。海波系统的十三个维度是:(D1)竞争优势;(D2)垂直知识;(D3)自愿披露;(D4)受限披露;(D5)代价支持协议;(D6)员工通过跳槽获利;(D7)存在明确的非竞争协议;(D8)员工转让产品工具;(D9)关于被告的保密协议;(D10)员工独立开发;(D11)保密协议具体内容;(D12)与被告谈判中的披露;(D13)采取的安全措施。其中,D1和D3两个维度是连续性的,D2、D4、D5、D6、D7、D9、D11和D12均属二元维度,D8属于一元维度,而D6和D10既可能属于一元维度,也可能属于二元维度,D13是一个包括8个要点的枚举范围。二是三层论证概念(3-ply argument)。“三层”分别是引用案例层、回应层和反驳层。首先,一方如起方引用了一个己方找到的案例。该案例应该尽可能地与本案例相似,要切中要点,根据遵循先例原则,所提出的建议是先例决定应该适用于本案,即使该决定成立。其次,应方通过区分(即指出显著的差异,这意味着不应该遵循先例)和引用其能够找到的反例来回应起方,而且反例至少要与起方所引案例一样切题。最后,起方试图反驳应方在第二阶段提出的论证,如:区分反例,强调本案与先例的类似性,表明差异的非决定性,如此等等。
在给出海波系统之后,阿什利与他的另一位学生阿里文合作研发了“卡托(CATO)系统”。海波系统与卡托系统的共同点是都关注美国商业秘密,但不同点是:首先,后者用“因素”(factor)代替了前者的“维度”(dimension);其次,海波系统有13个维度,而卡托系统有26个因素;在海波系统中,案件是用事实(fact)来表示的,而事实是用来判定维度在具体案例中是否活跃,若活跃则根据维度来确定案例的位置;因素虽然与事实相关,但其是分析者根据案例事实来指派的,故卡托系统中的因素只有分析者可见。卡托系统的二十六因素包括:(F1)谈判中的信息披露;(F2)贿赂员工;(F3)唯一开发员工;(F4)同意不公开;(F5)协议不具体;(F6)安全措施;(F7)携带工具;(F8)竞争优势;(F10)泄露秘密;(F11)垂直知识;(F12)泄密限制;(F13)非竞争协议;(F14)限制使用材料;(F15)独特产品;(F16)信息反向成为可工程化之物;(F17)信息独立生成;(F18)相同产品;(F19)无安全措施;(F20)竞争对手已知的信息;(F21)了解保密信息;(F22)侵入性技术;(F23)放弃保密;(F24)信息可通过其他渠道获得;(F25)信息逆向工程;(F26)欺骗;(F27)在公众论坛披露信息。需要注意的是,在卡托系统中没有F9,D5也没有任何体现,D13被细化为F6、F19和F27三个因素,而且,相对于海波系统而言,F14、F15、F16、F17、F18、F20、F21、F22、F23、F24、F25、F26这十二个因素均是新引入的。由此可见,案件推理系统建模具有高度语境感性,针对不同的领域,所设定的要素或因素均有重大差异。
此外,面向不同法律领域,里士兰与她的博士生们合作研发了一系列案例推理系统,比如,与斯卡拉克合作的针对家庭办公减税的“卡巴莱(CABARET)系统”以及与斯卡拉克、弗里德曼、丹尼尔斯等人合作的针对个人破产的“银行XX(BankXX)系统”和“斯皮尔(SPIRE)系统”。本奇卡鹏将海波系统之后发展起来的这类案例推理系统称为“超海波系统”,有时又被统称为“海波风格系统”。里士兰和阿什利提出海波系统的初心就是作为规则推理系统的辅助系统,值得注意的是,卡巴莱系统典型是一个规则推理与案例推理的混合系统。
规则推理建模与案例推理建模有时被视为两种相互竞争的方法。伯曼认为,这两种方法源自不同的愿望:前者更可能产生实际应用,其中的规则不仅取自成文法,还可取自专家的理解;后者更能抓住法律推理的本质所在,因为纯人工智能的一大主要目标就是准确地表示人类智能,表示法律思维,故法律领域中的案例推理研究必须继续。一般说来,规则推理研究进路与欧洲人有关,因为受塞科特等人1986年工作的启发以及民法在欧洲大陆的流行,他们热衷于用Prolog语言与逻辑来表示立法;而案例推理研究进路被认为是美国研究者所选择的进路,因为他们偏爱LISP语言(一种计算编辑语言),而且面对的是极富对抗性的普通法传统。在二十世纪八十年代的后期,两条进路被视为两种单独进路,其研究倾向于由不同的群体进行,在欧洲尤其为明显。然而,到了九十年代,不同进路的研究者们越来越倾向于将两种方法整合起来,前面提及的斯卡拉克和里士兰的卡巴莱系统就是两种研究进路整合的典范,而像本奇卡鹏这样的规则推理研究支持者也意识到需要案例来提供足够条件以能够解释法律条款。
特别值得关注的是,帕肯和沙托尔1998年提出的一种从案例到规则集的简洁整合方法。他们的起点是一个被表示为因素集的案例集及其结果,其中的因素可分为有利于起方的因素和有利于应方的因素,每一个因素都代表一个理由来决定其支持的一方。他们用Fp代表起方最强理由,即在案例中起方提出的所有因素集,用Fd代表应方最强理由,即案例中应方提出的所有因素集,用p和d分别代表起、应双方的决定,那么我们就有两条规则:r1:Fp→p;r2:Fd→d。假如案例结果表明了哪个理由优先,我们便可增加一条这两条规则何者优先的规则,如r3:r1>r2表示起方赢得了诉讼。他们认为,每个案例都可以用这种方式表示为三条规则,这样整个案例就可以重写为一个起方所找到的规则集,一个应方所找到的规则集和一个二者优先性不完全的集。
四、 大数据推理建模路径
规则推理建模路径的逻辑根基是演绎推理,案例推理建模路径的根基是非演绎推理,或者说是归纳推理或类比推理。然而,法律推理的非单调性与可废止性决定了所有前提真并不能保证必然推出结论也为真。把具有单调性和可废止性的法律推理建模建立在具有非单调性的演绎推理基础之上,这种做法本身就值得商榷。不过,面向人工智能的单调推理已经很好地解决了法律推理建模的逻辑根基问题。
如前所述,案例推理建模首先是作为规则推理建模的补充形式而出现的,其目的是用案例来帮助理解法律概念和法律术语。从这个意义讲,无论是规则推理建模路径,还是案例推理建模路径,它们关注的焦点就是从法律规范到法律解释之间的法律解释推理。传统法律推理建模路径显然忽略了诉讼论证博弈的一个至关重要的环节,即从法律证据到法律事实之间的证据推理或事实论证。在法律诉讼中,证据并不等同于事实。在证据与事实之间还存在一种推论关系或支持关系。有人认为,法律可以被描述为一个维特根斯坦意义上的语言博弈法律诉讼是一种论证博弈,起、应双方的博弈目标就是使己方合法利益最大化,而审方的目标就是维系法律理性,确保司法公正,因此,起、应、审方为了某种原因(如合法性或不利己方诉求)不出示或不采纳某些证据完全正常。大数据推理建模路径也许正好可以弥补两个传统研究进路之不足,因为大数据技术可以使得法律证据更加确凿。
何谓大数据呢?大数据是一个研究如何从数据集中系统提取信息并对之进行处理的领域,其中,这些数据集因为太大或太复杂无法用传统数据处理软件处理。根据福克斯的定义,大数据是需要并行计算工具来处理数据的地方,代表了通过并行编程理论所使用的计算机科学的一种明显而明确的变化,以及科德(Edgar F. Codd, 1923-2003)1970年提出的关系模型某些保障和能力的丧失。大数据有许多特征,其中最基本的三大特征是大量、多样和高速。首先,数据量非常庞大。数据的大小决定了其价值和潜在洞察力。大数据之所以量大,是因为它是一种不用随机分析法或随机抽样调查这样的捷径而采用对所有数据进行分析的方法。其次,数据类型多样化。大数据的多样性体现在其来源相当广泛,除来自文本之外,还可以来自图像、音频、视频等,而且通过数据融合还可以显现出其缺失的部分。第三,数据生成速度非常快。大数据的高速主要体现在其实时可用,主要与生成频率以及处理、记录和发布频率密切相关。与传统的小数据相比,大数据涉及更多的维度,更多的属性,从而导致较高的错误发现率。云端数据库可以通过廉价且数量众多的信息传感物联网设备实际收集各种数据,这些设备包括移动设备、航空遥感、软件日记、照相机、麦克风、射电识别阅读器、无线传感网络等。因此,大数据包括非结构化、半结构化和结构化的数据,但主要关注非结构化的数据。根据麦肯锡全球研究院2011年发布的《大数据:创新、竞争与生产力的下一个前沿》报告,大数据的主要构成要件与生态系统是:(1)分析数据的技术,如A/B测试、机器学习和自然语言处理;(2)大数据技术,如商业智能、云计算与云数据库;(3)可视化技术,如图表、图形以及其他数据展示。大数据需要利用数学分析、优化、归纳统计和非线性系统辨识的概念,从低信息密度的大数据集中推断出回归、非线性关系、因果效应等规律,揭示其中的相关关系和依赖关系,甚至对结果和行为进行预测。大数据挑战包括数据抓取、数据存储、数据分析、数据检索、数据共享、数据传输、数据可视化、数据查询、数据更新、信息隐私、数据来源等。
大数据被认为是我们这个时代最大的创新,但也被认为是最大的危险。大数据已经改变了社会科学的面貌,关于它将如何影响社会科学研究的方法论已经有了广泛的争论。法律体系当然也不可能免于其影响。首先,大数据不仅支持着立法与政策设计,同时也是司法、执法过程中政府官员、律师或法官的工具。决策所依据的初始数据都是以完整的实时格式提供的。政策决策效果可以通过数据输出来衡量,数据输出显示了微观层面的变化。大数据使立法者能够在较小的人口中试验和模拟某些法律决定,并即时衡量这些决策对某些产出的影响。其次,法律传统重视法律规则的一致性、稳定性和统一性,而大数据有望为法律提供一种科学证据方法。在大数据驱动的法律体系中,经验分析将取代专家的判断。以刑事判决为例,有人认为“仅仅依靠直觉和经验是不够的”,可能导致量刑不当,甚至可能是不道德的,许多情况下不仅不再需要判决,而且会导向不善的法律实践。大数据要求将数据收集到中央服务器,然后由匿名专家设计的算法进行分析。在某个法律体系中,裁判统一性是一条重要原则,既然相同的算法可以整个法律体系中动用,那么大数据算法会产生更一致的裁判。第三,大数据标志着行为优化和“个性化法律”的兴起,大规模的数据分析和预测技术被用来制定行为,并生成针对客户或受监管实体的法律指令和建议。在大数据时代,法律应该根据政策目标和人类最佳行为进行校准,这是基于对大量数据的机器分析,从而消除人类的偏见、无能和错误。大数据的出现催生了“大数据范式”。这种范式基于这样一种信念,即理论不再是必要的,因为基于算法的应用数学和统计技术能够“分析”数据并找到最优解决路径,而且比人类程序员做得更好。大数据从理性选择理论中唤起了神话般的全知行动者,在决定行动方向时,考虑了所有可用信息、事件发生的概率以及潜在的成本与收益。
大数据流行与法律经验主义运动有关,如行为法经济学和证据法学。行为法经济学关注的是法律行为人和代理人的偏见和错误,试图提供激励和补救措施,以确保最佳行为,从而使得法律推理和决策过程更加科学、客观和基于证据的做法当然应该受到称赞。这些行为优化举措与大数据一起加速了法律行业自动化和非中介化的趋势。例如,“个性化法律”的趋势是通过为个人提供一种选择,而非聘请专业人士来满足他们的法律需求。事实上,大数据已经开始改变律师事务所的工作方式,它提供了各种工具,其中包括预测法律成本和案件结果、管理合规数据以及降低文件审查成本。大数据也正在律师事务所之外传播,预测建模已改变了法律领域,从金融监管到取保候审以及刑事裁判。从犯罪防控到卫生举措,大数据在地方治理中也很受欢迎。我国智慧法院、智能检务、智慧公安等工程均充分利用了大数据技术。过去逃犯多会躲到人多嘈杂的地方,因为那些地方最不易被抓捕。如今,那些地方却成了逃犯最不应该去的,因为那些地方通常都安装了监控摄像头。比如,近几年常有逃犯在广州的迎春花市上落网的报道。
其实,无论执法、诉讼、法律决策还是法律文书起草之类的法律适用均可建立在大数据基础之上。比如,美国律商联讯公司(LexisNexis)研发的法律应用软件Lex Machina以及斯坦福大学法学院与图书馆共同研发的法律应用软件Ravel都是以大数据为基础的。Lex Machina与Ravel底层的逻辑推理几乎是一样的,在自然语言处理算法的帮助下从诉讼文件中提取信息,这些算法有能力进行机器学习,并以一种非常壮观的形式将结果可视化。大数据算法可用于挖掘先例或其他相关数据,以找出变量之间的相互关系,如在法官先前裁判中找到可以预测未来结果的共同因素。在相关法律领域,大数据技术可以发展到这样一个程度,即可以以高度准确的方式预测一个案件将如何做出裁决。
然而,大数据虽然宣称追求客观性和预测能力,但大数据的所谓客观性和预测能力可能被过于夸大了,至少当它被应用于法律系统这样高度复杂的进化系统时是如此。数据总是需要解释,这就需要理论和相应的主观评价判断。此外,大数据的预测能力也是有限的,更不可能预见法律体系从根本上的创造性、非算法的演变。数据本质上是主观的和不完整的,而不是客观的和决定性的。数据未必是中立的、客观的。比如,检察官的法定职责是充当中立的超然裁判官,但在实践中,他们往往以被告人有罪视角来侦查取证。再如,辩护律师的职责是积极有效地为其委托人辩护,故他们必须以委托人无罪或罪轻的角度来看待问题。
大数据推理,又可称为“基于大数据的推理”(big data-based reasoning)或“大数据驱动的推理”(big data-driven reasoning)。从推理建模角度来看,基于大数据的研究与简单统计研究并无不同,它们都是建立在大量的数据基础之上,由计算机执行,并使用统计和数学算法来处理数据。只不过,从方法和概念框架上看,简单统计研究以代表性数据为基础,运用了社会科学、数学和统计概念,而大数据研究使用了数学方法和叙事概念框架;从观察对象上看,简单统计研究涉及的是关于社会现象或文本的数据,而大数据研究涉及的是数据集,而且大多数情况下要将大量文本处理为数据;从观察数量上看,简单统计研究处理的是代表性样本,而大数据研究处理的是总体或数据集;从预测的可信度来看,简单统计研究的比较高,而大数据研究的非常高。作为一种不同于规则推理和案例推理的建模路径思想,大数据推理建模路径最早出现于萨斯坎德(Richard Susskind)2017年7月28-29日在上海百事通通信技术股份有限公司在杭州举办的“法律 科技领军者国际峰会”上的主题演讲。但到目前为止,大数据推理建模尚未正式成为一种法律人工智能的推理建模路径,仍然是一个亟待开拓的法律人工智能领域。
五、 余论
人工智能是作为人类智能的对应物出现的,是一种模拟、延伸和扩展人类智能的智能,其目标是让机器像人一样思考。一般说来,人类智能的模拟有两条道路:一是结构模拟,即仿照人脑的结构机制,制造出“类人脑”机器;二是功能模拟,也就是暂时撇开人脑的内部结构,仅从人脑的功能过程进行模拟。前者的目标是要实现通用人工智能甚至超级人工智能,而后者的目标是实现专用人工智能。然而,从技术上,目前人工智能研发都尚处于专用人工智能阶段,主要是从功能上进行模拟,其核心问题就是让机器进行自动推理。法律人工智能也不例外,其核心问题就是探究自动法律推理的实现,让机器像法律人一样思考。自上个世纪中叶以来,法律人工智能已形成了一个学术共同体。纵观其学术发展历程,我们不难发现,这一共同体主要聚焦于自动法律推理建模,而这种建模有两条经典路径——规则推理路径和案例推理路径,进入二十一世纪以来,大数据驱动又催生第三条自动法律推理建模路径,即大数据推理路径,而且还研发出一批落地的法律应用软件或法律机器人,如我国的智慧法院以及美国的Lex Machina和Reval,还有前文未提及但也有一定影响的IBM ROSS法律机器人。然而,根据阿什利的观点,“如果某个法律应用程序能够在进行论证或预测法律结果时考虑到从案例文本中提取的实质性特征,那么这个领域就向前迈出了一大步。Lex Machina、Ross和Ravel使用组合的语料库和从文本中提取信息的技术,很好地完成了这一步,但似乎还没有完成……法律推理的计算模型可以提供帮助。”这意味着,后三个标志性法律人工智能软件事实离自动法律推理实现还有一段距离。