小律所一群AI助手:2026年律师的真实AI工作流

大家好！今天再来看一例法律行业的一个典型的AI应用落地的案例。

先从一个真实的把小微律所经常遇到的“事故”扭转成“从大牌律所手里抢客户的成功故事”说起：

几个月前，客户收购案交割的前一晚，晚上七点。买方律师发来一封要求函，要求重组多项关键交易条款：新的托管条件、扩大的赔偿例外、修订后的交割交付清单。潜台词很清楚——接受这些修改，否则我们撤。

我把收购协议、披露附表和要求函上传给Claude。几分钟内，Claude 把所有修改项映射到现有交易条款，找到了买方律师显然没注意到的东西：他们提的两项例外，直接与他们在披露附表中已经确认的陈述相矛盾；第三项修改会在基本陈述条款中制造内部冲突，反而削弱买方自己的交割后保护。他们激进的最后一刻施压，漏洞百出。

谈判持续到深夜，邮件来回。我把每一封新通信都喂给Claude。它追踪每个提议的让步如何与协议中各个条款交互，标记接受某个修改会在另一个条款制造什么风险敞口，帮我构建出一套回应——该让步的让步，该坚持的坚持。到晚上十一点，我们有一套干净的反制立场，每一条都锚定在买方自己的语言上。第二天早上，交易按我客户满意的条件完成交割。

一个中型律所需要的三名初级律师干到天亮才能产出的分析，我不到两小时就得到了核心结论。

写这段话的人叫Zack Shapiro。他经营着一家两个人的精品律所，做创业公司设立、风险投资交易和监管业务。他的竞争对手是拥有数百甚至数千名律师的大所。按理说，他不应该能跟它们竞争。但过去一年让一件事变得清晰：一家围绕 AI 建立的小律所，不仅能跟大所平起平坐——它比大所更快、更彻底、成本结构在 18 个月前根本不可想象。

他把自己如何使用AI经营一家小律所的经验，在X平台上总结成一篇长文，目前的浏览量已～780万，并且也引来一阵热议。下面，我翻译整理加上解读写成一份完整的、可复现的工作流说明。不是理论，是日常操作。国内象我们帮企业搞AI落地的以及律所老板和从业者们，都值得借鉴学习！

注：Zack目前使用的是Cluade大模型，但不要误会是在给Claude打广告(虽然它确实很强,一系列toB的功能也做得不错)，对应的功能国内大模型厂商也能提供,或者走给企业定制开发。

一、为什么是Claude，而不是专业的"法律AI"？

市场上有太多专为法律打造的AI产品：Harvey、Spellbook、CoCounsel、Luminance。Zack 评估过大多数。对一个精品所律师来说，配置得当的通用 AI 比任何垂直产品都好用。差距不是一点点。原因分三层：

第一层：模板不是竞争力。

每个在你的执业领域里称职的律所，都有大致相同的模板。保密协议、股权购买协议、录用通知书——这些都是商品化输入。区分好律师和差律师的东西从来不是模板。是律师怎么用模板：怎么发现对方埋在 Section 14(c) 里的问题，怎么判断哪场赔偿斗争值得打、哪场该让步，怎么组织建议邮件让客户真正理解风险。这叫判断力。判断力不存在于律所层面。它存在于个体专业人员的层面。

当法律AI公司讨论"为你的律所定制 AI"时，他们解决的是一个几乎不重要的问题，忽略了一个至关重要的问题。真正的杠杆不来自 AI 从哪个模板起步，而来自告诉它怎么思考的指令：找什么、标什么、怎么权衡冲突、输出什么格式、对客户用什么语气。这些指令编码的是个体律师的判断力，而不是律所的模板库。

这正是Claude技能系统被设计来做的事。Zack创建了自定义指令文件——叫"技能"——编码了他的分析框架、偏好格式、语气和关于特定类型法律工作应该怎么做的判断。当他上传一份合同审查，Claude不应用某种通用框架，甚至不应用他律所的框架。它应用他的框架——他经过十几年执业磨炼出来的那个框架。

律所操作手册和个体律师的判断力之间的差别，就像给人一份菜谱和教人做菜之间的差别。

第二层：Claude(大模型类如国内的Deepseek,豆包等)是一个被深度优化用来写代码的模型。

这听起来跟法律执业毫无关系，直到你意识到这意味着什么：Claude 可以即时写代码，直接操控律师已经在用的应用程序。

每一个律师都在Word格式上浪费过生命。从别的文档粘贴后段落编号崩溃。样式死都不配合。跨版本修订模式损坏。交叉引用过期。每个句号和逗号都要手动调整的Bluebook引文格式。这些不是法律问题。这些是软件问题。而 Claude 通过写软件解决软件问题。

当Zack让Claude给合同应用修订模式，它不用插件或宏。它在XML层级打开 .docx 文件，写出Microsoft Word期望的精确标记，署上他的名字，保留所有格式细节。当他要统一一份法律意见书里的引用格式，Claude 写代码在几秒内解析并重新格式化每一条引用。结果与专家级人工工作无法区分，交付时间却只是一小部分。

这是任何法律 AI 垂直产品无法匹敌的能力差距。他们给你一个谈论文档的聊天机器人。Claude是一个能伸进文档内部、修改文档的系统。

第三层：通用AI的进化速度快于任何垂直产品。

你在前沿模型上，每一项新能力上线第一天你就拿到。你在一个封装产品上，你在等别人的工程团队决定接下来做什么。

Zack自己的执业领域是交易。但架构本身不限执业方向。诉讼律师可以建证词准备、动议起草、判例合成和发现审查的技能。税务律师可以建实体架构、意见书框架和监管监控的技能。家事律师可以建资产追踪和抚养权分析的技能。方法是相同的：拿一个强大的通用模型，教它你的执业方式，让它复利你的判断力。内容是你自己的。

二、三种模式：聊、干、写

Claude桌面应用有三种模式。学会该用哪一种，是让这一切奏效的最重要一步。

图示：Anthropic的Claude桌面应用程序界面

Chat（聊天）——对话界面。

Zack跟Claude说话的方式，就像跟一个坐在桌子对面、反应快、知识广的初级律师说话。在这里分析法律问题、脑暴谈判策略、对合同条款拿到第一手看法、从头起草。每一步都在掌控之中。大多数用过 ChatGPT 类工具的律师只体验过这种模式。

Cowork（协作）——自主模式。

这才是改变一切的模式。Zack把Claude指向电脑上的一个文件夹，给它一个任务，它就去干了。它读文件、创建新文件、编辑现有文档、自己决定怎么从A到B。有一份 40 页的协议需要完整修订对比？一堆交割文件要从条款清单生成？交给 Cowork，让它干活。这是大多数律师还没试过的模式。也是最会改变他们执业的模式。

Code（编码）——开发模式。

完整终端权限。大多数律师不需要天天用。但Zack有一种状况让他很难阅读长文档，于是他用 Code 模式构建了一个命令行工具，把法律文档转化成语音。整套管线：解析 Word 和 PDF，把"Section 4.2(b)(iii)"这种法律格式转化为自然语音，展开缩写，分块，送进 AI 语音 API，组装最终音频文件。他现在通勤时听合同。Claude 帮他构建了整件事。

三、教Claude你的执业方式

这是杠杆效应变得让人难以置信的部分。两年，不，三年前没人会相信。

Anthropic发布了一份构建自定义"技能"的指南：结构化的指令文件，教 Claude在特定上下文中如何行动。不是你每次都要打一遍的提示词。而是一套持久指令，在条件触发时自动生效。

Zack没有从头阅读这份指南。他把它上传给Claude，然后问了一个更好的问题：基于我们之间数百次对话——涵盖合同起草、客户邮件、文档编辑、法律研究和政策写作——哪六个技能对我的执业影响最大？

Claude分析了几个月的合作历史，识别出模式：哪些任务重复最频繁，哪里摩擦最大，结构化自动化在哪能省最多时间。它推荐的技能不是泛泛的。不是"更快地起草合同"——而是：

一个合同审查技能，带四种根据上下文切换的模式、严重程度评级、缺失条款检查清单、市场条款对标、以及当你准备好修改文档时无缝切换到修订编辑技能。

他们花了几小时细化细节。Zack在默认值不匹配他偏好时往回推。结果：六个可直接投产的技能打包成一个插件，安装进Cowork桌面应用——合同审查、修订编辑、合同起草、客户通信、法律研究、政策写作。每个技能编码了他多年积累的专业判断：覆盖他如何接近这一类型的工作。

对律所管理的关键含义：插件是可迁移的。 如果他有50名初级律师，他可以在每台机器上安装。每名初级律师立刻就能用他的分析框架产出一份合同审查，用他的语气起草通信，用他偏好的格式应用修订。过去需要多年师徒制传递的知识，现在是一个指令文件，从第一份草稿就生效。产出仍然需要律师审查，但审查从一个高得多的基线开始。

四、三个真实场景

场景一：不用打开Word的修订对比

对方律师发回一份带修订的协议。四十页的修改——陈述与保证、赔偿、知识产权、交割条件全动了。

Zack把文档上传给 Claude，说："帮我从客户的角度评估对方的修改。"他的合同审查技能自动激活。Claude按严重程度组织每一项修改，标记对方把风险移到了哪里，识别被修改条款之间的紧张关系，检查本应存在却没有的标准条款，产出一份总结，每一条问题都附具体反制语言。

然后他施加判断力。Claude标出了一个修订模式。他靠经验知道那个模式通常意味着什么。Claude为一个争议条款生成了三种不同的重构方案。他选了那个照顾到关系动态和交易语境——任何 AI 都无法访问的信息的版本。

一旦做出了决定，他告诉Claude应用修改。这是第一次看到时让人下巴掉下来的部分。 Claude在XML层级打开Word文档，应用署着他名字的真实修订标记，保留所有格式细节，产出一份干净的 .docx 文件——对方律师可以在 Microsoft Word中打开并正常审查的真实修订文件。Zack没打开Word。没打开 Litera。Claude生成了修订对比。他审查每一项修改，发送。然后客户通信技能用恰当的语气起草了附信。

从收到修订到准备好发送整套回复——不到一小时，其中约半小时是他自己的思考。

场景二：不会产生幻觉的研究

客户需要了解某个新产品的监管全景。问题跨越多个监管机构和重叠的法定框架。

Zack的研究技能指示Claude并行发起研究——同时从每个相关角度切入，而不是逐项顺序跑：证券分析、州的许可证要求、银行监管、消费者保护影响。每个子题跑多次搜索，交叉引用来源，优先于一手权威（法规、行政法规、监管指引、判例法）而非二手评论。

把任何东西交给Zack之前，这个技能要求Claude运行自我审查。这是关键步骤，也是大多数跳过的一步。Claude 必须验证每条被引用的权威来源确实说了备忘录声称的内容。必须标记任何置信度低于"高"的东西。必须检查不同部分之间是否存在内部矛盾。而且，必须特别防范幻觉引文——那个让好几位律师被惩戒、上了全国新闻的问题。

那些提交了 AI 造假引文的律师，用的是没有这种验证层的工具。问题从来不是 AI 本身。问题是没有质量控制的 AI。

产出是一份结构化的研究备忘录：结论前置总结、具体法规引用、实用建议——传统上需要一名初级律师花几天才能产出。Claude在一小时内交付初稿。然后Zack逐条审查引用，压力测试分析，在判断力偏离输出的地方修改。总时间仍是从零开始的零头。因为技能被校准到他的标准——自信的结论附带明确的不确定性标志、对比监管框架的表格、实用建议而非学术性的两边都说——备忘录立刻就能用。

场景三：实时合同解读

客户早上打电话：刚收到对方发来的要求函，声称违反商业服务协议，威胁终止。48小时内回应。

Zack上传了协议、要求函、以及客户过去三个月跟对方的所有通信。Claude把要求函中的每一条事实指控映射到被引用的具体合同条款，发现：四项指控侵权行为中，有两项引用的义务已经被对方自己的律师起草的补充函明确修改过。这份要求函显然是在没有检查其自身修正文件的情况下写的。

更有意思的是之后发生的事。Zack在准备回应时，把每一段草稿都跑过 Claude，压力测试他的论点是否会对协议中其他条款产生意外影响。Claude抓到了一个：他计划在服务级别指标上提出的一个辩护，可能被解读为在 Section 7 的付款争议上让步。他重写了回应。

这种在主动起草过程中逐条实时压力测试的能力，过去需要第二名律师审查你的工作。现在在同一场对话里完成。

五、特权问题：律师都问的

每个问过AI的律师都在问。

简答：允许你把文件存在云存储、电子发现平台和在线法律研究数据库上使用的同一框架，同样适用。ABA指南和各州律师协会伦理意见将AI工具视作受代理/工具例外保护的技术提供商。你的义务是采取合理措施保护客户数据——在实践上意味着关闭输入用于模型训练的选项、理解服务商的数据处理方式、以及记录你的推理过程。

Anthropic提供了零数据保留的API选项和业务数据处理协议。你的客户数据不用于训练模型，输入不在会话之外存储。这和你把客户文件放进Dropbox、Google Drive或Clio之前进行的尽职调查是一样的。

Zack还多做了一步。他让Claude帮他在委托书中起草了一个AI使用条款。条款将AI定义为效率和质量增强工具，强调律师监督，将数据处理绑定到现有保密义务，并获取客户同意。客户签字时毫不眨眼。他们大多数默认他已经在用 AI。他们的假设是对的。

伦理规则在大多数司法管辖区已经要求技术能力。Zack的判断是直接且尖锐的：我们正在接近这样一个临界点——不使用这些工具，反而是更难以自我辩护的职业责任立场。

六、提示词即技能

大多数尝试AI的律师会输入"审查这份合同"，得到一个平庸的回复。然后断定AI对法律工作没用。

问题不在AI。问题在输入。

对比一下。这是"审查这份合同"。这是"从供应商角度审查这份服务协议。标记客户在哪些地方将风险转移到了超出此类交易的市场惯例之外。检查是否缺失本应存在的条款——包括责任上限、知识产权所有权、数据处理和便利终止权。产出一份带严重程度评级的总结，每条高风险问题附上具体反制语言。注意供应商谈判筹码有限且希望快速完成交易，因此建议应聚焦于值得争取的条款和应该优雅让步的条款。"

第二个版本产出的工作成果，第一轮就能用。第一个版本产出的，即使有用也需要大量修改。"AI是个玩具"和"AI改变了我执业"之间的全部差距，存在于你指令的质量里。

这就是为什么技能如此重要：它们编码了这种详细程度，你写一次，它每次都自动生效。

七、这改变了什么

几件事值得被点名。

人员配置。 Zack经营一家两个人的律所，却承载了大得多的工作量。这是AI的直接结果。传统上需要招一名初级律师才合理的工作——第一轮文档审查、研究备忘录、初稿、修订对比摘要、日常通信——现在由Claude在他监督下完成。要清楚：每一份离开他律所的文件，都经过执业律师的审查、修改和批准。AI 产出首轮草稿。他产出最终工作成果。初级律师不会被淘汰。但从经济学上判断，什么时候该招一名初级律师的门槛已经上移了。 而且需要他们做什么已经变了：判断力、客户关系、AI产出的监督——而不是2000小时的文档生产。

计价。 AI改变了价值方程。对某些任务，节省的时间显而易见，他把节省传递给客户。对另一些任务，同样的小时数产出了比之前可能实现的更深得多的分析、更全面的问题发现和更高质量的起草。重点不是每项任务花的时间更少。而是每一小时律师时间产出了更多价值。

Zack的律所提供订阅定价和传统小时计费并行，取决于委托内容。订阅客户享受持续顾问、合同审查、合规监控和日常治理——固定月费。没有计费表在跑。AI让这个模式得以运行，因为他在可预测的费用结构内交付了更全面的服务。客户爱它——他们不怕拿起电话或发邮件。收入也可预测，而不是时多时少。

判断力。 上面描述的一切都制造了一种诱惑：让AI做太多。停止检查。研究结论是一致的：在 AI 能力范围之外使用 AI 的人，或信任 AI 却不审视其输出的人，表现比完全不用 AI 的人更差。

能靠这项技术胜出的律师，在最底层的认知上是清醒的：AI 不在从事法律执业。你是在从事法律执业。AI 让你更快、更彻底、更一致。但判断力——你决定为何而争为何而让的部分，你在字里行间读出那些没说出口的东西的部分，你做出一个可能左右两面的判断然后用自己的声誉压在上面的部分——那是你的。

有经验的律师在这个新世界里拿着巨大的优势，他们大多还没意识到。 如果你在执业领域已经花了十年或二十年发展判断力，你正坐在那个 AI 让它变得更加值钱的资产上，而不是贬值。

八、开始行动

Zack不为Anthropic工作。他只是一个执业律师，尝试了市面上所有的 AI 工具，然后围绕那个最好用的——对真实的他的工作方式而言最好用的——建立了自己的执业体系。

绝大部分律师使用 AI 的方式（在一个聊天框里输入一个问题然后寄希望于最好结果）和上文描述的东西之间的差距，是巨大的。弥合这个差距不需要技术能力。它需要投入几小时学习这个工具实际上怎么运作：Chat和Cowork的区别、为什么长而详细的提示词比短的效果好得多、怎么建一个编码你判断力的技能、怎么把技能打包成一个任何同事都能用的插件。

步骤：

下载桌面应用
选择你最常做的那个任务
写一条提示词，详细描述你希望它怎么做——不是"审查这份合同"，而是你对一份好审查的所有具体要求
看它回来什么
迭代两次
把它存成技能
看复利曲线开始爬升

结尾：两条曲线，两种未来

在所有AI改造行业的叙事里，法律行业通常被描述成最后会变的那种——职业壁垒、监管保护、文字工作天然需要"人的判断"。Zack Shapiro的实战记录击穿了这个假设。

它暴露了两件事。

第一，法律AI产品的真正瓶颈不是模板不是判例库而是判断力编码。 一个律师最值钱的资产——经过多年实践积累的框架、触觉、本能——现在可以被写成一个技能文件，在每次相关场景中自动激活。这不是"AI 会替代律师"的故事。这是"懂得把自己的判断力教给 AI 的律师正在拉大跟不教的律师之间的差距"的故事。

第二，通用AI的"旁路攻击"。 当法律垂直产品还在争论怎么把聊天框嵌入文档编辑器时，通用前沿模型已经能直接在XML层级操控 .docx 文件了。这不是更好的法律搜索。这是更好的软件工程能力被重新应用于法律工作流。那些砸几百万美元融资做垂直法律 AI 的公司，正在面临的竞争不是彼此——是Anthropic、OpenAI这样的平台公司本身。

对中国的律师来说，这篇文章提供了一个比美国的语境更自由的切入点：国内律所的信息化建设比美国同行晚了一个时代，但在AI面前这是一个机会——你可以直接跳过老一代律所花十年建立的文档管理、知识管理、模板系统，直接进入 AI-native(AI原生)的执业模式。

一个律师、一台笔记本、六个技能文件。这就是一家完全能跟百人所正面竞争的产品交付单元。

不是说AI让律师变得多余。是说慢的律师会输给快的律师。不用 AI 的律师会输给把自己的十年判断力写成技能的律师。

参考资料

原文来自 Zack Shapiro @X 平台长文《The Claude-Native Law Firm》，2026 年 2 月。Zack Shapiro 是执业律师，经营一家两人精品律所，专注创业公司设立、风险投资交易和监管业务。https://x.com/zackbshapiro/status/2027389987444957625