第一编 外国的法律人工智能
第一章 英美法系的法律人工智能
第一节 美国的法律人工智能
一、美国法律人工智能发展历史概述
人工智能与法律是人工智能研究的经典领域,法律为人工智能提供了富有挑战性的课题,而法律本身也日益重视对人工智能领域的规制。
早在20世纪50年代,美国的法律人工智能研究已经发端。 1957年科特(Fred Kort)发表的《用数学方法预测最高法院的判决:对律师案件权利的定量分析》,代表了这一时期法律人工智能研究的特点:受制于当时的计算能力,彼时人工智能采用分步骤地人工设定规则( hand-crafted rules)的方式对法律问题进行分析。布坎南( Buchanan)和亨德里克( Headrick)于1970年发表的《人工智能和法律推理的推测》一文对法律研究和推理进行建模的可能性,对法律检索、推理、咨询、分析和论据构建的发展提出了建议,并准确地预见了类比推理的重要性。11977年麦卡蒂( L. Thorne McCarty)里程碑式地介绍了TAXMAN系统,采用了定理证明方法来对公司税法中的问题进行推理。2随着互联网的建立,法律信息获取技术也崭露头角。
至20世纪80年代,美国的法律人工智能领域的研究迅猛增加,人工智能研究团体之间不断加强联系,法律人工智能两大基础方法之一的基于案件的法律推理逐步建立。 80年代末90年代初凯文·阿什利( Kevin Ashley)发表了在法律人工智能领域的重要论文《法律论证建模》,详细构建了英美法系中相关度评估、案件比较以及使用相关相似性和不同性来类比和区分案件等要素的方式。以此构建出的HYPO系统成为法律人工智能领域的首个基于案件的( case-based)法律推理工具。其后,这一系统发展出众多衍生系统,知名的如文森特( Vincent Aleven)开发的CATO系统,成为法科生创建基于案例的论点的重要工具,HYPO / CATO也成为评价其他系统和理论的标志性系统。
在21世纪,机器学习、数据挖掘、观点挖掘等技术成为法律人工智能的主要研究方向,法律人工智能越来越迸发出与现实结合的生命力,不再停留于系统和模型阶段,而是在行政管理、证明责任分配、法律社交网络、法律文本信息获取等方面发挥着更加直接和现实的作用。
最近十年,大数据分析给法律人工智能的发展带来了新的机遇和挑战。据世界知识产权组织( World Intellectual Property Organization,简称 WIPO)数据显示3,机器学习仍然在人工智能领域专利申请中占主导地位。此外,模糊逻辑和逻辑编程相关的专利申请也呈现上升趋势。在机器学习中,深度学习是成长最迅速的领域,其次是多任务学习。
二、美国法律人工智能的应用场景
美国人工智能研究和咨询公司EMERJ经过分析和评估,将人工智能在法律中的应用总结为六大领域:尽职调查( Due Diligence) 、预测技术( Predic-tion Technology) 、法律分析( Legal Analytics) 、文件自动化( Document Automa-tion) 、知识产权( Intellectual Property)和电子化记账( Electronic Billing) 。4上述任何一个领域都不可避免地会出现不同的法律技术和方法的综合应用:尽职调查主要涉及合同审核、法律搜索或研究以及电子发现等内容;预测技术主要指通过人工智能软件生成判决、预测诉讼结果;法律分析指使用过去判例法中的数据点5、胜诉/败诉率以及法官的历史记录来分析趋势和模式;文件自动化则是指律师事务所使用的基于输入的数据而形成的填写好的模板软件;知识产权组合分析是指通过分析众多的知识产权组合以从中获取见解;电子化记账是指自动记录律师的计费工时。
(一)尽职调查:合同审核、法律检索与电子发现
尽职调查是一项复合型的法律工作,这一工作的内容主要包括合同审核、法律检索和电子发现。本项工作的难点不仅在于高昂的时间、金钱和人力成本,而是即便如此规模的投入,仍然难以避免出现疏漏和错误。
从主体上来看,在美国从事本领域业务的有专门从事法律人工智能的公司,如总部设立在芝加哥的iManage、哥伦比亚大学同研究人员共同创建的eBrevia、总部位于旧金山的创业公司Legal Robot;以及专门面向美国个别州的法律人工智能系统,如专门提供加州法律服务的Judicata公司。此外,一些知名律所、投资银行的法律部门也建立起自己的法律人工智能系统,如摩根大通的COIN系统。律所、会计师事务所、公司等实体既可以是法律人工智能服务的提供商,也可以是法律人工智能产品和服务的购买者。
同尽职调查相关的产品和服务主要采用的是自然语言处理和机器学习技术。 AI在并购业务的尽职调查领域中发挥着尤其重要的作用。从目标公司或卖家的角度,AI具备如下功能:(1)协助收集文件并进行分类;( 2)协助形成披露日程以及识别需要披露的文件以尽量避免卖家可能承担的责任;(3)提取关键信息;(4)发现文件中的反常之处。
具体来说,首先,在合同审核领域,相关系统可以从客户上传的文本中提取相关文本数据,决定哪些数据同客户寻找的信息相关,如并购交易中与控制权转移相关的数据。具备此种功能的产品如eBrevia。其次,在法律搜索领域,相关系统可以将客户上传的法律文件同数据库中的上千份文件进行对比,也可以对文件通过光学字符识别( Optical Character Recognition),对文件进行数字化和分析处理。用户仅需输入所需要查找的特定法条类型,平台就可以摘取所有相关条款。除eBrevia之外,iManage也致力于提升法律检索的智能化程度。最后,在电子发现方面,相关产品将自动搜索数据库中同客户上传的文件高度相关的文件,筛选出与客户提供的文件最相关的文件,对可能涉及诉讼相关的电子证据进行归档和再现,“公司律师可以轻松访问影响法律程序进程的关键文件”6,此类公司如DISCO。此外,还有主要提供自动修订(对文件中某些信息进行遮盖等处理)服务的Catalyst,融合法律检索和电子发现两项功能的Exterro公司开发的Whatsun系统。
AI在尽职调查领域的应用也引发了一些争议,主要包括以下问题:(1)责任问题。当使用AI处理争议条款时,可能会因算法或者程序训练不足而产生错误的结论。在此情况下,使用该AI软件的律所或公司一般是有责任的,但AI软件的制造商是否应该承担责任呢?(2)在发生网络攻击的情况下,AI的应用可能导致敏感信息和机密信息的泄漏。 (3)在使用法律人工智能将文件送给第三方之前如不抹除元数据可能违反律师和客户之间的保密协定。
(二)预测技术:对案件的预测与对文件的预测
律师每一天都面临着提供影响客户商业计划、交易结构、诉讼赢面和开销等服务。广义的预测技术包含多种内容,如上文提到的电子发现中预测相关文件、预测性编码(在神经系统中对认知冗余进行缩减以进行高效编码的统一框架)、预测法院决定和预测案件结果等。
众多学者在对最高法院判决结果的预测方面进行了持续的探索,在较近的研究中,研究人员利用最高法院的数据库,从表决中提取出16个特征并建立起算法架构。7
不过,同美国最高法院每年八十个左右的判例相比,客户更加关注和解与撤诉的可能性。在具体产品和服务领域,来自于斯坦福大学法学院和计算机系建立的Lex Machina致力于预测法庭、法官、律师和当事人的行为,预测诸如某个法官准许或者否决某个动议的可能性有多大、案件需要多长时间才能获得永久禁令、得到审理或者审理终结、法官认定专利侵权、是否合理地使用商标或者违反《证券法》的可能性有多大等问题。在相关文件预测方面,来自华盛顿的 Intraspexion 拥有的专利软件系统可以搜索高风险的文件,并按照风险大小的顺序进行排列。预测性编码则建立起在神经系统中对认知冗余进行缩减以进行高效编码的统一框架。
(三)法律分析:对案件的分析和对人的分析
传统上,法律分析需要律师通过阅读案件材料和摘要来进行。当前的人工智能技术已经可以从这些文档中提取关键的数据点,以方便法律分析。
法律分析进一步体现为对人的分析和对案件的分析。对案件的分析如前所述,但目前的研究方向更加倾向于研究对方律师、主审法官等人的行为模式。 Lex Machina的法律分析软件不仅可以查找出原告、代理律师和其他起诉人的信息,还可以生成数据分析对方律师胜诉或者败诉的可能性。 Ra-ven Law的官网则显示其可以提供主审法官审理过的案件信息、巡回法庭和裁判信息。目前该公司正在和哈佛大学法学院曾合作,致力于美国判例法的数字化。
(四)文件自动化:可重复使用的模板
文件自动化致力于将已经存在的法律文件自动生成模板,用生成的模板形成新的法律文件。文件自动化的好处在于提升工作效率的同时,又减少了出错的可能性。不仅如此,高效也带来更好的客户体验,交付速度都是客户日益期望和要求的。更重要的,是文件自动化的本质是作为律师事务所的知识存储库,从而避免律师离开律所时随之而失去的智力和专业知识。
当前从事文档自动化业务的公司颇多,如Legito、Smokeball、DocuSign等不同产品的基础功能比较一致,通过将常用的文档和表格转换成可以重复使用的模板,使用户可以在短时间内创建自定义文档,且功能能够和微软Word软件相适配,方便一键转化。 Legito官网显示,其已为全球123429家公司和个人提供服务,包括斯柯达、Aber律师事务所等;Smokeball 官网显示,该公司旗下的软件可以自动生成200多种法律文件。
(五)知识产权:从简化文件操作到一站式服务
法律人工智能进入知识产权领域的重要原因在于专利申请过程时间跨度长而任务艰巨。传统的专利搜索需要人工调查研究成百上千份的专利文件。根据世界知识产权组织(WIPO)的数据(2018 年为目前可获得的最新数据),全球共有近250000项专利申请,在过去的15年里年平均增长率为5%,除了欧美等成熟经济体的缓速增长,全球对专利申请的需求已在相当长的时期内以惊人的速度增长。知识产权领域的高度专业性、申请高难度以及日益增长的申请需求共同推动了法律人工智能向这一领域的倾斜。
在具体应用方面, Anaqua公司开发的AQX平台致力于提供一站式的知识产权服务。该平台提供知识产权整个生命周期的战略性管理,不仅可以让客户了解到保护己方知识产权的信息,还可以提供对公开及不公开数据进行分析的服务,评估该项知识产权的创新度,生成知识产权评估报告。除此之外,还能搜索相关专利,并对各项专利进行快速分析。据称,该平台已为59个国家的1000000名客户提供服务。8同样,专门从事知识产权业务的Smar-tshell 公司提供的服务则更加倾向于文件的自动化,其主要采用自然语言处理的方法。客户输入专利申请号,Smartshell即可智能扫描和提取专利审核回应,对审查员的问题进行突出显示,滚动并清理先前的权利要求,从众多可选择的模板中创建自定义的回应模式,并以文档形式展现。9
(六)电子化记账:提高效率的有效工具
电子化记账的目标在于减少订单争议,进行客户导向的调整,同时也可更加准确地报告和追踪工作时间。
上文中已经提及的Smokeball 同时也提供电子化记账服务。 Smokeball的记账功能可以集成于法律业务管理软件中,与客户的业务实现无缝衔接。10该平台通过云应用程序实现对每个文件进行准确、快速的计费,并且发票开出频率高,无论是按小时收费、固定收费还是偶然性工作都实现了高效的记账。
电子化记账也颇具争论。首先,不同的记账系统提供商有不同的记账指引,而不同的公司有各自的提交指引,想要实现从律所到付费账户的一站式送达仍存在中间障碍。其次,目前电子化记账缺乏统一的准则,尽管大多数供应商和客户系统基于统一任务管理系统和法律电子数据交换标准,但是每个提供商对于上传和追踪都有一些不同的协议,而且客户难免会要求对其中的交易标准或任务代码进行修改。当客户群体扩展到数万计的时候,系统提供商面临着巨大挑战。最后,电子化记账真的如此便捷吗?电子化记账的流程大致如下:必须根据为该特定客户开发的模板将账单打印到文件中。然后,将其转到共享驱动器进行审查。接下来,开票人可能需要手动操作文件或进行抽查。之后,开票人必须登录到电子计费系统,找到客户,上传账单。如果账单被接受,则必须记录确认;如果账单被拒绝,该过程将重新开始。实时追踪记账虽然看似增加收入,但是公司也往往会拒绝小于一定数额的账单。
三、美国法律人工智能的大潮与挑战
(一)律师职责范围的变化与美国律师协会示范规则的修改
法律人工智能在法律工作者的生产力起到了越来越大的效果,但与此同时也引发了人们对律师能力、勤勉和监督义务的关注。
2012年,美国律师协会( ABA)修改了示范规则。根据示范规则第1. 1条之规定,律师有义务向客户提供“胜任的代理”,这意味着律师必须证明其进行了尽职代理,证明其具有为进行代理所必备的知识、技能,为代理进行了彻底的准备。该条注释8提出了技术能力要求,律师精通用于代表客户的技术;律师负有考虑的义务,即应考虑使用包括机器学习在内的技术能否更好地提供服务,目前已有38个州采用了此规则。11
美国的许多州都意识到法律人工智能对律师职责范围的影响。《纽约郡律师协会职业道德委员会第749号正式意见》(2017)要求律师在使用技术代表客户的范围内具有技术能力,即律师本人拥有必要的技术知识,或者至少能和拥有技术知识的一个或者多个人员建立联系。12
(二)算法歧视与公平正义的张力
法律禁止歧视,但难处在于人类是否能够发现歧视。就法律人工智能而言,对数据的依赖并不能推定算法提供的就是真理,因为算法也常常植根于过往的歧视。潜在的算法歧视体现在刑事法官用来评估累犯风险的软件中出现的种族差异风险分类,体现在差异化定价策略中,也展现在针对不同种族和性别群体的广告中。13
在美国,COMPAS是被纽约州、威斯康星州、加利福尼亚州等司法辖区所广泛使用的一种基于算法评估特定被告的累犯风险的软件。14非盈利新闻机构ProPublica于2016年的一项研究表明,该软件对黑人表现出明显的偏见,黑人被告更可能被错误地判定为高风险,即便算法本身可能并未将种族纳入衡量因素。虽然COMPAS提供的结论仅仅具有参考作用,但由于认知偏差,大脑在处理复杂问题时会自然地倾向于依赖短时间内就可以解决问题的方式去处理问题,这种认识偏见会导致法官过分依赖COMPAS评分。加州圣克鲁兹市是美国最早采用预测性警务的城市之一,但其却于2020年6月明确禁止使用预测性警务技术,盖缘预测性警务会对有色人种产生的偏见和歧视紧密相关。15
随着人工智能的普及,COMPAS这样的预测算法可能会在司法系统中变得越来越多。需要在提高效率的同时,寻找能够消除细微差别的解决方案以克服各种偏差。
(三)技术的“黑匣子”
虽然人工智能已经越来越多地参与到法律工作的诸多流程之中,人们在依赖人工智能生成的结果时,却很难理解特定的技术是如何查询、分析数据并输出结果的。人工智能工具成为一个技术的“黑匣子”。
技术“黑匣子”同法律人工智能的其他问题如影随形。从律师的勤勉尽职义务角度来说,律师必须在多深的程度上了解“黑匣子”的内部运作方式,才能满足勤勉尽职的道德职责?如何处理对律师“技术能力”的要求同私人开发的算法知识产权保护之间的关系?COMPAS已经获得了商业秘密保护,这意味着COMPAS的算法、软件、使用的数据类型以及权衡每个数据点的方式几乎不受第三方审查。这种制约不仅仅适用于律师,也适用于提出量刑建议的检察官。随着我们对技术的依赖程度和不公平事件的出现频率不断增加,这些问题将继续出现。
在算法歧视方面,如果用以搭建算法的数据点等关键因素作为商业秘密而得到保护,研究人员只能从结果的演算上去估量某一产品的潜在歧视,这也引起了对公平正义观念的探讨。例如,ProPublica从COMPAS的计算结果中得出结论,黑人被该软件评判为高风险而实际上却未成为累犯的误判率要高于白人;而COMPAS所属公司则根据算法认为该软件对不同人种的预测准确率是相同的。16
四、小结
美国人工智能发端早且应用场景丰富。本节主要从尽职调查、预测技术、法律分析、文件自动化、知识产权、电子化记账六个部分分析了当前的应用软件和在法律等方面值得商榷之处。可以看到,人工智能其实已经触及法律工作的各个方面,虽不完美,但是美国也通过修改相关法律文件等方式重新调整法律关系。然而,一旦触碰到公平正义的逆鳞,也会摒弃法律人工智能在某具体领域的运用。
1 See Bruce G.Buchanan, Tbomas E. Headrick,Some speculation about ArtificialIntelligemceand Legal Reasoning, 23(1) Stanford Law Review 40, 62(1972).
2 See Edwina L. Rissland et.al, AI and Law: Afruitful synergy, http://www.iaail.org/?=q-page/ailaw#fn6,last access: Aug.21, 2020.
3 See WIPO, Technology Trends ArtificialIntelligence,https://www.wipo.int/edocs/pub-docs/en/wipo_pub_1055.pdf,last access: Aug.21, 2020.
4 See Emerj,AIinLawandLegal - PracticeAComprehensiveViewof35CurrentApplications, Business Intelligence and Analytics, https:/-/emerj.com/aisector-overviews/ai-in-law--legalpractice-current-applications/,last access: Aug.21, 2020.
5 数据点是信息的离散单位。一般而言,任何单个事实都是一个数据点。在统计或分析的背景下,数据点通常是经过测量或研究得出的,并且可以用数字和/或图形表示。术语数据点大致相当于基准的、单数形式的数据。
6 Exterro, E-Discovery Data Management Product Brief, https://www. exterro. com/resources/e-discovery-data-managment/, last access: Aug. 21, 2020.
7 Matthew Hutson, Artificial intelligence prevails at predicting Supreme Court decisions, ht-tps://www. sciencemag. org/news/2017/05/artificial-intelligence-prevails-predicting-supreme-court-decisions, last access: Aug. 21, 2020.
8 Anaqua, Expect More From Your IP, https://go. anaqua. com/l/361891/2019-10-14/x6762g, last access: Aug. 21, 2020.
9 ROWAN, SmartShell FAQ, https://rowanpatents. com/smartshell-faq/#toggle-id-5, lastaccess: Aug. 21, 2020.
10 Smokeball, Legal Billing Software, https://www. smokeball. com/features/legal-time-and-billing-software/,last access: Aug. 21, 2020.
11 Tech Competennce, LawSite, https://www. lawsitesblog. com/tech-competence#google_vi-gnette, last access: Aug. 21, 2020.
12 https:/-/www.jdsupra.com/legalnews/ethicalinformation-gathering-when-11208/.
13 Diane Holtet.al.Examining Technology Bias: Do AlgorithmsIntroduce Ethical & LegalChallenges? ABA Businesslawsection, https:/--biasalgorithms-introduce-ethical-legal-challenges/last access: Aug./businesslawtoday.org/2019/03/examiningtechnology-21, 2020.
14 Andrew L Park,Injustice Ex Machina: Predictive Algorithmsin Criminal Sentencing, UCLALaw Review, https:/-/www.uclalawreview.org/injusticeex-machina-predictive-algorithms-in-crimi--nalsentencing/,last access: Aug.21, 2020.
15K risti Sturgill, Santa Cruz becomes the first U.S. city to ban predictive policing, Los Angeles- Times, https://www.latimes.com/california/story/202006-26/santa-cruz-becomes-first-u-s-cit--yto-ban-predictive-policing#:~:text=Nearly%20a%20decade%20ago%2C%20Santa,U.S.% 20 =to%20adopt%20predictive%20policing. &textIn%20a%20unanimous%20decision%20Tuesday, from%20using%20facial%20recognition%20software, last access: Aug. 21, 2020.
16 Sam Corbett-Davies, A computer program used for bail and sentencing decisions was labeled biased against blacks. It's actually not that clear, The Washington Post, https://www. washingtonpost. com/news/monkey-cage/wp/2016/10/17/can-an-algorithm-be-racist-our-analysis-is-more-cau-tious-than-propublicas/? noredirect=on&utm_term=. fa2ecb6503a8, last access: Oct. 17, 2017.