当“本院认为”开始由AI生成

本文是 @余念杂陈第65篇文章，全文字数约5300字。

今天，我读到 @法知能LawAI 发布的《用Harness揭秘AI辅助审判 | 上篇：深圳的大型试验》。尽管我是抱着学习法律AI的目的打开这篇文章，但是当我读到“AI开始生成本院认为”，我后知后觉地一阵颤栗。

这些年，尤其是近两年，AI技术的指数性跃升对全球司法体系与法律服务行业产生了深远的重塑作用，它能帮忙检索案例，审查合同，生成法律备忘录，起草尽调报告。很多大型律所甚至已经把 AI 纳入标准化工作流。

这些变化当然惊人，但某种程度上，我仍然把它理解为一种“工具升级”。但当我读到文章中写到「法官先确认事实和争议焦点，再由 AI 生成完整的“本院认为”，法官修改、审核、签发。」我意识到，事情已经不同。

因为在一篇裁判文书中，“本院认为”不是固定模板，而是法官解释自己为什么这样判的地方，是法律从规则走向说理的地方，也是整个裁判行为最核心的智识部分。

以前，我们认为AI最多帮助法官做一些“脏活累活”：送达、校对、计算利息、整理卷宗、推送法条。可现在，AI 开始写“本院认为”，进入法律解释和法律推理。

很难说我的颤栗是因为什么，它当然有技术跃迁带来的激动，但是也有一种难以名状的隐忧。

文章介绍的深圳模式绝非一次简单的技术试用。

文章介绍，深圳中院在2024年6月正式上线了一套自主研发的 AI 辅助审判系统。这套系统不是个别法官私下用 ChatGPT 写判决，也不是只处理程序性事务的工具，而是系统性地进入裁判推理过程。它会辅助法官阅卷、提取事实、归纳争议焦点、推送类案和法条，并在法官作出初步判断后，生成“本院认为”的说理文本。

这被研究者称为“全球首例”：第一个由法院机构系统性地将大语言模型嵌入裁判推理过程的案例。

这句话的分量很重，因为尽管全球许多国家都在探索将AI引入法律工作，但多数仍然停留在外围，辅助性、事务性工作。欧盟对于AI+法律的态度仍然谨慎，在《人工智能法案》将协助司法机构研究和解释事实与法律、并将法律适用于具体案件的 AI 系统列为“高风险”系统。

相比起来，深圳模式确实更进一步——它跨过了很多系统仍然试图回避的边界：AI 不只是整理案件，不只是检索法条，不只是生成摘要，而是直接生成裁判理由。

深圳案例也不是一次荒诞的技术冒险，我相信它是中国司法体系发展到今天的一种必然结果。

“案多人少”一直是中国司法系统面临的结构性矛盾，深圳尤其如此，基层法官年均办案量超过400件，对于法官而言，司法效率不仅是个抽象的管理指标，而是每天都压在桌面上的现实问题。因此，引入这么一套AI系统能够帮助法官整理材料、校对数据、归纳焦点、提示法条，甚至直接生成一份文书初稿，当然极具现实意义。

更何况，深圳是一个技术资源高度密集的城市，有产业条件，也有政策土壤。因此，这一模式率先在深圳特区试行毫不奇怪。

同时，中国司法系统长期强调同案同判、裁判统一、审判质效、风险控制和可预测性，而 AI 最擅长的恰恰就是这些：结构化、标准化、规模化、可检索、可复用。

所以，AI 并不是突然闯入中国司法。它更像是中国司法治理逻辑自然延伸出的技术形态。

文章介绍的深圳系统上线后的数字也很有说服力：36个工作日内，辅助阅卷5万余件，辅助庭审2万余次，辅助生成裁判文书5万余份。系统上线首月，全市法院民商事案件结案同比上升，平均结案时间明显缩短。文章中甚至有人把这个变化称为“司法生产力的工业革命”。

你很难反对这样的系统，因为这看起来太有效了。

但是，这种有效可能也是一种风险。

过去我们讨论法律AI，常常关注的是错误，如何避免大模型幻觉，减少错误，避免AI编造法条、虚构案例，比如美国曾经出现过律师使用 ChatGPT 生成法律研究，结果提交了不存在的案例，最终被法院制裁。这类事件很容易引发讨论，因为它符合我们对 AI 的初级恐惧：AI可能会胡说八道。

但是，深圳案例的优点，同时也是我的忧点，不是它错误，而是它正确。

文章介绍了这套AI 辅助审判系统最核心的技术之一是 RAG（检索增强生成），RAG强调了“溯源优先”，意味着当 AI 需要引用法条、案例、司法解释时必须先从给定的法律数据库中检索，再基于检索结果组织文字，RAG正是为了解决大模型幻觉问题。

这当然是重大进步，没有人希望一个司法系统建立在胡编乱造之上。

但RAG的另一面，是一种“历史答案压缩机制”。它最擅长的，不是创造新解释，而是从既有材料中寻找：最稳妥、最相似、最可验证、最低风险的答案。AI 审判系统意味着，现代法律系统正将法律解释与推理都让位给数据计算和概率匹配。

然而，法律从来不仅是规则的逻辑演绎，或者说，它不应只是规则的逻辑推演。法律当然需要规则，需要统一，需要可预测性。否则，法治就会滑向任意裁量。但法律同时也存在社会价值的动态平衡和个体正义的实质实现，而个体正义常常依赖于人的判断而不仅仅是规则匹配。“法院认为”部分不仅仅是找到可适用的法律条款，可引用的典型案例，更重要的是法官如何运用智识，将规则、事实、价值判断、社会经验组织成公共理由。

立法永远是滞后的，现实生活总会先于规则发生。新的交易结构、新的家庭形态、新的劳动关系、新的平台秩序、新的技术风险，都会不断把法律推到边界地带。这个时候，司法需要的不是条文检索、案例索引，而是法律解释、漏洞填补，甚至通过判决与裁量创造新的规则、避免实质不公。

在规则与现实的摩擦，法律与社会变迁的张力，个案与统一性的冲突中，通过法官的说理、律师的抗辩、学者的批判、少数派意见、新类型案件，成文法得以不断重新解释，甚至创造自己。这就是卢曼提出法律自创生系统的理论，法律系统并不是靠机械重复规则运转的。法律真正的生命力，来自它持续不断地产生新的法律沟通、新的合法性解释、新的边界。

AI司法意味着裁判将越来越依赖：成文的法律规定、标准的裁判规则、历史案例的复用。这会使得司法更稳定，但也可能更僵硬。

这就是法律现实主义早就提醒过我们的：法律并不是一个可以通过三段论完美推导的封闭体系。“纸面上的法律”和“行动中的法律”之间，始终存在巨大差距。法官的经验、制度处境、社会现实、价值判断，都会影响法律最终如何落地。

然而今天，AI 可能带来一种新的形式主义与保守主义。是的,AI将有助于实现类案同判，能够高效率地输出看起来文本逻辑严密、结构完整、表述规范、语气权威的结果。然而，AI司法并不真正理解人的处境，也不真正置身于社会冲突之中。它处理的是模式、概率和相关性，而法律处理的常常是无法彻底形式化的价值冲突——公平与效率、自由与安全、个案正义与裁判统一、规则稳定与社会便签。

如果将法律推理彻底委托给这种只懂语法概率而不懂社会语境的AI，意味着法律将会越来越依赖历史答案，将失去其适应社会变迁、修正过时判例和纠正历史不公的“流动性”（Law Fluidity），最终失去其自我演化能力，“AI可能会杀死法律”。

而且，微妙的变化还发生在法律互动本身。

过去，法律至少还是：律师与律师、律师与法官、法官与社会之间的说理互动。而“法院认为”部分则尤其被强调作为阐明裁判结论的形成过程与正当性，增强司法透明度与公信力的释法说理的空间。尽管在这些说理互动中，有些说理并不总是充分，哪怕很多文书也会模板化、格式化，但法律至少保留着一种公共理由的形式。

但现在，这个互动在发生变化。原告律师用 AI 写起诉状。被告律师用 AI 写答辩状，法官用 AI 写判决书。

从形式上看，人仍然在场。

律师还在署名，法官还在盖章，裁判权也仍然掌握在人手里。但实质上，法律互动中的大量推理环节，已经被机器预处理，甚至，法律互动将越来越像AI 与 AI 之间的信息交换。

尽管我们可以说，人类仍然在环（Human-in-the-loop）。但问题在于，如果一个系统已经提前整理好事实、法条、类案、争议焦点和裁判理由，那么人类的审查很容易从“重新思考”变成“校对确认”。

尤其在高认知负担下，当一个法官一年处理几百件案件时，推翻 AI 已经写好的那份“看起来很合理”的文本，是需要额外成本的，甚至是违背人性的。

行为科学早就告诉我们，人会受到锚定效应、确认偏误和自动化偏误的影响。面对一份结构完整、语气专业、引用充分的系统文本，人天然会倾向于把它作为思考的起点，并在后续审查中寻找支持它的理由。

文章中有句话值得警醒，一位法官说“AI 的出现可能确实会对法官的思维产生限制。” AI真正危险的地方不是替代人，而是AI可能会限制人、禁锢人，它会逐渐预设人的思维路径。

这不仅是在法院，也发生在律所以及法律行业的各个场景。现在，很多大型律所（尤其是美国律所）正在广泛引入 Harvey、CoCounsel 等 AI 工具，用来替代初级律师过去承担的法律检索、尽调审阅、合同比对、备忘录初稿等工作。短期看，这极大提高效率，也降低成本。一个过去需要数名初级律师熬夜完成的任务，现在可能由一个资深律师给出指令，再由 AI 在几分钟内生成初稿。

但问题是，年轻律师过去就是通过这些“低级工作”成长的。查案例、翻卷宗、改合同、做尽调、写第一版备忘录，当然很苦，也常常重复、琐碎、低效。但法律判断力并不是凭空长出来的。它恰恰是在这些笨拙的、耗时的、经常出错又不断被修改的工作里形成的。一个年轻律师，只有在无数份判决中慢慢分辨什么是关键事实，只有在一次次被合伙人删改意见后理解什么叫法律风险，只有在看似枯燥的尽调底稿里发现一个隐藏问题，才会真正形成法律人的嗅觉。

但现在，越来越多年轻法律人第一次接触案件时，已经看到的是 AI 整理后的版本。他们学会的是如何优化 prompt，如何让 AI 输出更像法律文本，如何审查引用是否真实。但他们未必还能经历完整的法律推理生成过程。这是一种学徒制的断裂，也可能是法律职业的认知衰退。

当一代法律人越来越习惯从 AI 那里获得结构完美、逻辑自洽的法律综述，他们可能会逐渐失去亲手搭建法律论证的能力。五年、十年后，当这些人成为合伙人、法官、法务总监，他们当然会更熟练地调用 AI，但他们是否仍然有足够的能力审查 AI、质疑 AI、推翻 AI？如果答案是否定的，那么法律共同体失去的就不只是几个初级岗位，而是判断力的代际传承。

深圳模式并不是孤立事件。它只是全球法律系统算法化的一部分。

在中国，AI 被用来应对案多人少、类案同判和审判质效压力；在英美，AI 被大型律所和法律科技公司用来压缩成本、提升交付、重塑法律服务市场；在欧盟，司法 AI 被纳入“高风险”监管框架，强调基本权利、透明度和人类监督；在拉美和全球南方，AI 更多承担案件分流和系统减压功能，帮助濒临过载的法院维持运转。

不同国家的路径不同，但它们面对的是同一个时代问题：现代法律系统正在被重新组织。

法律活动越来越像一种工程流程。案件被拆解成字段，事实被提取成标签，争点被归纳成模块，裁判被生成成文本，风险被转化为概率，人的判断被放置在系统输出之后。

这不只是技术变化，也是治理变化：AI会让法律开始越来越像：工程系统、风险管理系统、数据治理接口。这让我想起劳伦斯·莱斯格在1999年出版的《Code and Other Laws of Cyberspace》提出的那个论断“代码即法律”。

但不仅是法律。

法律不过是技术治理逻辑的应用范例之一。

从平台治理到算法治理，从信用评分到智能行政，从风险控制到自动化决策，现代社会的治理越来越深度的依赖AI，而AI治理则越来越无法容忍模糊、例外、不确定性、不可预测性。它倾向于把复杂的人转化为数据，把冲突转化为指标，把裁量转化为流程，把判断转化为输出。

然而，当公共服务与社会治理越来越由AI接管，原本属于一线工作人员的自由裁量和同理心，可能会逐渐消亡。

一个基层工作人员、一个法官、一个执法者，至少还有可能根据具体情境作出迟疑、宽容和解释，但是一个AI系统，如果不能依靠后台系统设计者和数据架构师的编码，它将无法提供任何“人情”，它无法理解混乱、困顿和例外，它只知道字段不完整、条件不满足、风险未消除。

我并不是在反对 AI 进入司法，AI一定会进入司法，一定会进入法律服务，事实上早已进入。拒绝讨论它，或者用一种怀旧姿态说“法律必须完全由人来完成”，并不现实，也不诚实。

AI 可以帮助法官从重复劳动中解放出来，可以减少低级错误，可以提升文书规范性，可以帮助当事人更快获得裁判，也可以让法律服务变得更便宜、更可及。这些价值都必须承认。

真正的问题不是要不要 AI，而是我们究竟希望它进入到哪里，停在哪里，以及人必须守住什么。如果法律只是为了输出一个稳定答案，那么 AI 也许会成为法律最理想的形态。它比人更快、更稳、更统一、更少疲惫，也更少情绪波动。但如果法律还承担着解释社会、安放冲突、提供公共理由、回应具体处境、允许价值张力存在的功能，那么我们就必须承认并且警惕——法律不能完全变成工程学。

它当然需要规则。甚至需要代码。但它也需要：迟疑、争辩、例外、少数意见、创造性解释。很多时候，正是这些看似低效的东西，使法律仍然像法律，而不只是治理系统中的一个模块。

未来的问题，早不是 AI 会不会进入司法或其他社会治理领域，而是当现代治理越来越像一个实时运行的算法系统，当我们越来越追求统一、稳定、可预测、可计算，那些原本无法被彻底形式化的东西——迟疑、同情、例外、少数意见、对具体处境的理解——是否还会被允许存在？

这不仅是法律的问题。这是我们究竟希望拥抱什么样的社会治理的问题。