法律组织AI落地(三):法律AI场景成熟度判断

前两篇分别讲了技术路线怎么选法务部及律所AI落地五大技术路径选择和人员素养怎么评估法律组织AI落地之二：人员素养五级评估，这一篇进入另一个核心问题，针对场景进行分析。假设现在工具和人都准备好了，紧接着你就会面临下一个问题，法律AI项目到底从哪个场景切入？

我在接触许多法务部进行培训的时候，发现很多负责人对场景的判断都比较随性，要么靠直觉，要么靠厂商推荐，要么靠员工提供“灵感”。实际情况是，直觉经常出错，厂商推荐则天然带着"我有什么就推什么"的偏差，所谓的“灵感”也可能是某种错觉。

这样的认知差距还是因为隔行的思维观念造成的，大部分AI产品经理都清楚“场景即是一切”，场景是否具备成熟度和可行性几乎就决定了产品成败，本篇文章希望破除这样的认知差距，一次性讲清楚场景问题。

一、全球法务AI场景成熟度

综合Juro、LegalOn、ACC、CLOC、FTI以及日本、欧美等法域的调研数据，我把法务工作中最主要的七个AI应用场景做了一次成熟度排序，数据更新截至2026年5月15日。

1. 合同审查/红线建议

这是现在全球企业法务里AI落地最成熟、ROI信号最清晰的品类。Juro调研显示，58%的法务团队在过去12个月做过AI辅助合同审查，31%做过AI 红线修改；LegalOn 2026年报告里，52%的团队已在用或正在评估AI合同审查工具，87%认为AI会明显帮助合同审查与红线修改。合同审查排名第一很合理，在所有法务场景里它的输入输出最标准化，输入是一份合同文本，输出是风险点标记和修改建议，质量好坏一目了然，并且天然嵌在法务部最高频的工作流里，提效也很明显，选择这个场景是几乎不会出错的。

2. 法律/案例检索

根据调研，这属于法律工作者个人使用最普遍的场景，但部门统一治理还没搞起来。Juro数据显示83%的法务人员在过去12个月用AI做过法律研究，77.91%的受访者接触或使用过法律检索类AI。虽然数字好看，看起来也比较成熟，但有一个微妙的差异值得注意，大量法律工作者使用属于个人行为，自己打开ChatGPT或Claude查法规找判例，这个行为并没有被纳入部门正式工作流，法律检索的"使用率"高，"组织化程度"低，很多部门还处在"个人用"的阶段。

此外，我还见过有的单位脑门一拍要自己做一个法律法规动态库以便检索，这种想法也是比较天真，忽视了技术投入和时间投入，要真的有这个实力自己开一个法律科技公司算了，何必大刀砍豆腐，法律/案例检索这个场景已经高度成熟，通常不建议自研或者自己做库，直接以SaaS/MCP/API等方式调用最合算。

3. 条款/合同起草

Juro调研显示，79%的法务做过AI辅助条款起草，但只有24%做过整份合同的自动生成；来自日本的调研里，AI用户中49.8%用于契约条款草拟。这个数字落差说明AI在"条款片段级别"的写作辅助上已经够用了，多数人觉得好使，但"整份合同从零生成"的可靠程度，还远达不到法务敢直接拿去用的水平。实际操作中也是这样，绝大多数人是让AI写个初稿或者某几段条款，然后自己大改，这同样意味着这个场景偏个性化，多数情况下对话型AI就能直接覆盖此类零散需求，很可能根本不需要专门做一个工作来处理此类法律工作，当然也有一些法律科技公司有做过这种场景，但是我个人对这个场景是否值得做是存疑的。

4. 知识提取及问答

这个场景很好做，技术上简单，但是对数字化基础的要求高。根据调研，日本AI用户中46.8%用于要点整理和比较表资料生成，在企业端，许多机构已经把大规模合同与监管材料的信息抽取纳入了知识管理流程。AI做问答这件事本身并不难，但问题是你喂给它的材料够不够干净、权限控制够不够细。多数法务部门的知识管理现状，坦白说还没到能让AI发挥作用的水平，要么就是没有知识库，要么就是知识库很乱混杂了太多无用和过时的信息。数字化基础太差的话，是没有必要做这个场景的，做了最终日活不会太高。

5. 合规流程

ACC 2025调研中，46%的受访者认为合规工作具备明显成本节约潜力；CLOC的法务技术栈数据里，隐私管理系统使用率36%，AI使用率29%。想在合规场景用好AI，前提是你的合规体系本身已经数字化了，政策库是结构化的，流程在线上跑，此外内部也有大量已经书面化、正常运营的合规程序。没有这个基础，单独买一个AI合规工具解决不了问题。目前推出的Claude for legal本质上就是一种合规AI，其思路是把企业内部流程利用skill方式固定下来，未来GPT等平台也可能会推出类似的法律插件，这些插件对于企业资产合规制度及流程都具备一定的参考价值。

6.工作流自动化

CLOC调研演示，工作流自动化使用率44%。目前跑得比较成熟的是"规则+模板+AI"的混合流，纯AI驱动的工作流还很少见，典型场景是标准化程度高的法律文书，比如NDA和简单服务协议，用模板加变量填充加AI微调，能出一个七八成可用的初稿，再推送给相关业务人员进行二次确定，同时异步推送给法务提前完成AI审核，这种就是典型的自动工作流。该场景目前依然不成熟，主要原因是嵌入企业内部各种系统需要大量的工程化工作，且嵌入本身高度依赖于工程水平，没办法很好的处理各种边缘情况，不一定能实现多好的自动流效果。

7. 诉讼预测/案件策略

在所有公开调研中，这是采用比例最低的品类。ACC 2025里45%的受访者认为诉讼有成本节约空间，个别企业已经在用AI做判决模拟与诉讼准备，但整体仍处于概念验证阶段，诉讼对准确性的容忍度天然最低，对手律师会利用你出的每一个错，AI幻觉在这个场景下的代价极高。诉讼的核心价值在策略判断，用什么论点、打什么节奏、怎么拆对方的逻辑，这些AI目前帮不上太多，可以用AI做事实梳理、时间线重构、证据可视化这些辅助性工作，但策略层面的决策仍然得靠人，各位诉讼律师/诉讼法务其实还是比较安全的。

二、国内法务AI的场景格局

全球数据差不多了，那回到国内。国内目前没有一份像ACC或Juro那样覆盖面广的企业法务AI调研，根据相关法律科技公司公开的数据和我个人接触的上百家样本，国内企业法务部的AI部门级活跃使用率大致在15%到30%之间，跟美国部门级45%-60%相比，差距明显。

国内法律AI市场可以分成五层，每一层服务的场景和客户群体都不同：

侧重G端服务的厂商。靠政府订单、国产化要求和权威数据为主，场景以司法裁判辅助和法规检索为主，跟企业法务部的需求交集有限。

AI法律科技厂商。场景集中在合同审查和文书生成，纯SaaS模式的日子越来越难过，能做到技能化、私有化部署、嵌入客户业务流程的，才有活路。

数据厂商AI化。常见场景是法规检索和判例分析，最近都在往AI问答方向走，优势在内容资产和律师社区，这类产品在检索场景下有独特价值，因为它们的数据经过编辑标注，结构化程度高，通用模型在这方面的可靠性暂时还不够。

通用大模型行业版。许多模型商都在持续蚕食垂直产品的"模型层"价值，也有一部分在探索招聘法律AI交叉人才，以求将专业场景做深。通用大模型场景覆盖面广，合同审查、法律检索、文书起草都能做，虽然每个场景的深度可能不如专业产品，但胜在通用性和迭代速度。

大厂法务部自研。根据公开招聘信息，美团、蔚来等大型法务部，都在公开招聘相关人才，以自建法务AI产品，场景从合同审查到合规问答到文书生成，覆盖面各有不同，自建的优势在于能深度嵌入自己的业务流程和数据资产，劣势在于工程投入大，需要法律工程师这种专职角色。

三、如何评估一个场景的AI落地成熟度

这里有一个简单的评估框架供参考：

1. 场景频次

这个场景在你的团队里每周发生多少次？合同审查如果一周二三十份甚至更多，那就是天然的第一切入点；法律检索同理，团队每天都在查法规找判例的话，AI的使用频率就能撑起来；一个月做一两次深度法律研究的话，这个场景的优先级就往后排。

2. 输入输出的标准化程度

AI擅长处理"输入明确、输出可定义"的任务。合同审查是典型中的典型，输入是一份合同文本，输出是风险点列表和修改建议，输出好不好对照着合同条款看就知道了；条款起草也有一定的标准化程度，但比审查低，因为"写得好"的标准比"审得对"更模糊；到了法律意见书这个层级，标准化程度就更低了，AI能帮你做结构和素材整理，但最终的判断和措辞得你自己来。

3. 容错空间

出错了代价有多大？合同审查AI漏了一个风险点，后面还有人工复核环节兜底；法律检索AI给了一条有问题的判例引用，你交叉验证一下就能发现，这两个场景的容错空间都比较大，适合先试。诉讼文书就完全不同了，你提交给法院的每一个字都可能被对方律师拿来做文章，合规意见也是，给业务部门的合规结论如果有误，可能直接导致业务决策出错，这些容错空间小的场景，等AI能力更成熟、团队也积累了足够的AI协作经验之后再考虑比较稳妥。

4. 现有工作流的嵌入难度

最好的切入场景是"在现有流程的某一步加一个AI环节"，别总是想着推翻现有流程重新来。合同审查之所以最适合先切入，除了前面说的几个原因之外，还有一个很实际的因素，它本来就是法务工作流里的一个独立环节，加上AI之后变成"AI初审+人工复核"，整个流程的结构没有变，只是某一步的执行方式变了。反过来，如果你想在合规尽调场景用AI，就得面对一个麻烦，尽调的工作流本身就不标准，每个项目的文件结构、信息来源、输出要求都不一样，你得先把尽调的工作流理清楚了再谈AI嵌入，工作流本身混乱的场景，加AI只会更乱。

5. 通用模型在这个场景下的能力边界

在第一篇讲技术路线的时候提过技术替代线这个分析工具，通用大模型的能力在持续提升，很多曾经需要垂直产品才能做的事，现在通用模型已经能做到六七成甚至更高。

在法律咨询、基础合同生成、法条检索这三个场景上，通用模型已经把垂直产品的存在价值压缩到"省事、即开即用、有客服"几个有限的维度，相较之下专门针对某一法律场景的专用AI在现阶段是大量承压，不知道还能活多久。

在合同审查、文书生成、知识管理这三个场景上，通用模型大概能达到60%的可用度，但企业法务真正需要的是"嵌入审批流、嵌入OA，这些工程层面的需求，通用模型的对话框满足不了。

结语

场景选择其实是一个资源分配问题，每个团队精力有限、IT支持有限、管理层的耐心有限，选错场景浪费的不只是钱，还有组织对AI这件事的信心，一口吃下大胖子是不现实的，先把一个场景做到位，第一个场景跑通了，有了数据和团队信心，第二个场景的落地速度会快很多。