几个月前,客户收购案交割的前一晚,晚上七点。买方律师发来一封要求函,要求重组多项关键交易条款:新的托管条件、扩大的赔偿例外、修订后的交割交付清单。潜台词很清楚——接受这些修改,否则我们撤。
我把收购协议、披露附表和要求函上传给Claude。几分钟内,Claude 把所有修改项映射到现有交易条款,找到了买方律师显然没注意到的东西:他们提的两项例外,直接与他们在披露附表中已经确认的陈述相矛盾;第三项修改会在基本陈述条款中制造内部冲突,反而削弱买方自己的交割后保护。他们激进的最后一刻施压,漏洞百出。
谈判持续到深夜,邮件来回。我把每一封新通信都喂给Claude。它追踪每个提议的让步如何与协议中各个条款交互,标记接受某个修改会在另一个条款制造什么风险敞口,帮我构建出一套回应——该让步的让步,该坚持的坚持。到晚上十一点,我们有一套干净的反制立场,每一条都锚定在买方自己的语言上。第二天早上,交易按我客户满意的条件完成交割。
一个中型律所需要的三名初级律师干到天亮才能产出的分析,我不到两小时就得到了核心结论。
写这段话的人叫Zack Shapiro。他经营着一家两个人的精品律所,做创业公司设立、风险投资交易和监管业务。他的竞争对手是拥有数百甚至数千名律师的大所。按理说,他不应该能跟它们竞争。但过去一年让一件事变得清晰:一家围绕 AI 建立的小律所,不仅能跟大所平起平坐——它比大所更快、更彻底、成本结构在 18 个月前根本不可想象。

他把自己如何使用AI经营一家小律所的经验,在X平台上总结成一篇长文,目前的浏览量已~780万,并且也引来一阵热议。下面,我翻译整理加上解读写成一份完整的、可复现的工作流说明。不是理论,是日常操作。国内象我们帮企业搞AI落地的以及律所老板和从业者们,都值得借鉴学习!
注:Zack目前使用的是Cluade大模型,但不要误会是在给Claude打广告(虽然它确实很强,一系列toB的功能也做得不错),对应的功能国内大模型厂商也能提供,或者走给企业定制开发。
一、为什么是Claude,而不是专业的"法律AI"?
市场上有太多专为法律打造的AI产品:Harvey、Spellbook、CoCounsel、Luminance。Zack 评估过大多数。对一个精品所律师来说,配置得当的通用 AI 比任何垂直产品都好用。差距不是一点点。原因分三层:
第一层:模板不是竞争力。
每个在你的执业领域里称职的律所,都有大致相同的模板。保密协议、股权购买协议、录用通知书——这些都是商品化输入。区分好律师和差律师的东西从来不是模板。是律师怎么用模板:怎么发现对方埋在 Section 14(c) 里的问题,怎么判断哪场赔偿斗争值得打、哪场该让步,怎么组织建议邮件让客户真正理解风险。这叫判断力。判断力不存在于律所层面。它存在于个体专业人员的层面。
当法律AI公司讨论"为你的律所定制 AI"时,他们解决的是一个几乎不重要的问题,忽略了一个至关重要的问题。真正的杠杆不来自 AI 从哪个模板起步,而来自告诉它怎么思考的指令:找什么、标什么、怎么权衡冲突、输出什么格式、对客户用什么语气。这些指令编码的是个体律师的判断力,而不是律所的模板库。
这正是Claude技能系统被设计来做的事。Zack创建了自定义指令文件——叫"技能"——编码了他的分析框架、偏好格式、语气和关于特定类型法律工作应该怎么做的判断。当他上传一份合同审查,Claude不应用某种通用框架,甚至不应用他律所的框架。它应用他的框架——他经过十几年执业磨炼出来的那个框架。
律所操作手册和个体律师的判断力之间的差别,就像给人一份菜谱和教人做菜之间的差别。
第二层:Claude(大模型类如国内的Deepseek,豆包等)是一个被深度优化用来写代码的模型。
这听起来跟法律执业毫无关系,直到你意识到这意味着什么:Claude 可以即时写代码,直接操控律师已经在用的应用程序。
每一个律师都在Word格式上浪费过生命。从别的文档粘贴后段落编号崩溃。样式死都不配合。跨版本修订模式损坏。交叉引用过期。每个句号和逗号都要手动调整的Bluebook引文格式。这些不是法律问题。这些是软件问题。而 Claude 通过写软件解决软件问题。
当Zack让Claude给合同应用修订模式,它不用插件或宏。它在XML层级打开 .docx 文件,写出Microsoft Word期望的精确标记,署上他的名字,保留所有格式细节。当他要统一一份法律意见书里的引用格式,Claude 写代码在几秒内解析并重新格式化每一条引用。结果与专家级人工工作无法区分,交付时间却只是一小部分。
这是任何法律 AI 垂直产品无法匹敌的能力差距。他们给你一个谈论文档的聊天机器人。Claude是一个能伸进文档内部、修改文档的系统。
第三层:通用AI的进化速度快于任何垂直产品。
你在前沿模型上,每一项新能力上线第一天你就拿到。你在一个封装产品上,你在等别人的工程团队决定接下来做什么。
Zack自己的执业领域是交易。但架构本身不限执业方向。诉讼律师可以建证词准备、动议起草、判例合成和发现审查的技能。税务律师可以建实体架构、意见书框架和监管监控的技能。家事律师可以建资产追踪和抚养权分析的技能。方法是相同的:拿一个强大的通用模型,教它你的执业方式,让它复利你的判断力。内容是你自己的。
二、三种模式:聊、干、写
Claude桌面应用有三种模式。学会该用哪一种,是让这一切奏效的最重要一步。

Chat(聊天)——对话界面。
Zack跟Claude说话的方式,就像跟一个坐在桌子对面、反应快、知识广的初级律师说话。在这里分析法律问题、脑暴谈判策略、对合同条款拿到第一手看法、从头起草。每一步都在掌控之中。大多数用过 ChatGPT 类工具的律师只体验过这种模式。
Cowork(协作)——自主模式。
这才是改变一切的模式。Zack把Claude指向电脑上的一个文件夹,给它一个任务,它就去干了。它读文件、创建新文件、编辑现有文档、自己决定怎么从A到B。有一份 40 页的协议需要完整修订对比?一堆交割文件要从条款清单生成?交给 Cowork,让它干活。这是大多数律师还没试过的模式。也是最会改变他们执业的模式。
Code(编码)——开发模式。
完整终端权限。大多数律师不需要天天用。但Zack有一种状况让他很难阅读长文档,于是他用 Code 模式构建了一个命令行工具,把法律文档转化成语音。整套管线:解析 Word 和 PDF,把"Section 4.2(b)(iii)"这种法律格式转化为自然语音,展开缩写,分块,送进 AI 语音 API,组装最终音频文件。他现在通勤时听合同。Claude 帮他构建了整件事。
三、教Claude你的执业方式
这是杠杆效应变得让人难以置信的部分。两年,不,三年前没人会相信。
Anthropic发布了一份构建自定义"技能"的指南:结构化的指令文件,教 Claude在特定上下文中如何行动。不是你每次都要打一遍的提示词。而是一套持久指令,在条件触发时自动生效。
Zack没有从头阅读这份指南。他把它上传给Claude,然后问了一个更好的问题:基于我们之间数百次对话——涵盖合同起草、客户邮件、文档编辑、法律研究和政策写作——哪六个技能对我的执业影响最大?
Claude分析了几个月的合作历史,识别出模式:哪些任务重复最频繁,哪里摩擦最大,结构化自动化在哪能省最多时间。它推荐的技能不是泛泛的。不是"更快地起草合同"——而是:
一个合同审查技能,带四种根据上下文切换的模式、严重程度评级、缺失条款检查清单、市场条款对标、以及当你准备好修改文档时无缝切换到修订编辑技能。
他们花了几小时细化细节。Zack在默认值不匹配他偏好时往回推。结果:六个可直接投产的技能打包成一个插件,安装进Cowork桌面应用——合同审查、修订编辑、合同起草、客户通信、法律研究、政策写作。每个技能编码了他多年积累的专业判断:覆盖他如何接近这一类型的工作。
对律所管理的关键含义:插件是可迁移的。 如果他有50名初级律师,他可以在每台机器上安装。每名初级律师立刻就能用他的分析框架产出一份合同审查,用他的语气起草通信,用他偏好的格式应用修订。过去需要多年师徒制传递的知识,现在是一个指令文件,从第一份草稿就生效。产出仍然需要律师审查,但审查从一个高得多的基线开始。
四、三个真实场景
场景一:不用打开Word的修订对比
对方律师发回一份带修订的协议。四十页的修改——陈述与保证、赔偿、知识产权、交割条件全动了。
Zack把文档上传给 Claude,说:"帮我从客户的角度评估对方的修改。"他的合同审查技能自动激活。Claude按严重程度组织每一项修改,标记对方把风险移到了哪里,识别被修改条款之间的紧张关系,检查本应存在却没有的标准条款,产出一份总结,每一条问题都附具体反制语言。
然后他施加判断力。Claude标出了一个修订模式。他靠经验知道那个模式通常意味着什么。Claude为一个争议条款生成了三种不同的重构方案。他选了那个照顾到关系动态和交易语境——任何 AI 都无法访问的信息的版本。
一旦做出了决定,他告诉Claude应用修改。这是第一次看到时让人下巴掉下来的部分。 Claude在XML层级打开Word文档,应用署着他名字的真实修订标记,保留所有格式细节,产出一份干净的 .docx 文件——对方律师可以在 Microsoft Word中打开并正常审查的真实修订文件。Zack没打开Word。没打开 Litera。Claude生成了修订对比。他审查每一项修改,发送。然后客户通信技能用恰当的语气起草了附信。
从收到修订到准备好发送整套回复——不到一小时,其中约半小时是他自己的思考。
场景二:不会产生幻觉的研究
客户需要了解某个新产品的监管全景。问题跨越多个监管机构和重叠的法定框架。
Zack的研究技能指示Claude并行发起研究——同时从每个相关角度切入,而不是逐项顺序跑:证券分析、州的许可证要求、银行监管、消费者保护影响。每个子题跑多次搜索,交叉引用来源,优先于一手权威(法规、行政法规、监管指引、判例法)而非二手评论。
把任何东西交给Zack之前,这个技能要求Claude运行自我审查。这是关键步骤,也是大多数跳过的一步。Claude 必须验证每条被引用的权威来源确实说了备忘录声称的内容。必须标记任何置信度低于"高"的东西。必须检查不同部分之间是否存在内部矛盾。而且,必须特别防范幻觉引文——那个让好几位律师被惩戒、上了全国新闻的问题。
那些提交了 AI 造假引文的律师,用的是没有这种验证层的工具。问题从来不是 AI 本身。问题是没有质量控制的 AI。
产出是一份结构化的研究备忘录:结论前置总结、具体法规引用、实用建议——传统上需要一名初级律师花几天才能产出。Claude在一小时内交付初稿。然后Zack逐条审查引用,压力测试分析,在判断力偏离输出的地方修改。总时间仍是从零开始的零头。因为技能被校准到他的标准——自信的结论附带明确的不确定性标志、对比监管框架的表格、实用建议而非学术性的两边都说——备忘录立刻就能用。
场景三:实时合同解读
客户早上打电话:刚收到对方发来的要求函,声称违反商业服务协议,威胁终止。48小时内回应。
Zack上传了协议、要求函、以及客户过去三个月跟对方的所有通信。Claude把要求函中的每一条事实指控映射到被引用的具体合同条款,发现:四项指控侵权行为中,有两项引用的义务已经被对方自己的律师起草的补充函明确修改过。这份要求函显然是在没有检查其自身修正文件的情况下写的。
更有意思的是之后发生的事。Zack在准备回应时,把每一段草稿都跑过 Claude,压力测试他的论点是否会对协议中其他条款产生意外影响。Claude抓到了一个:他计划在服务级别指标上提出的一个辩护,可能被解读为在 Section 7 的付款争议上让步。他重写了回应。
这种在主动起草过程中逐条实时压力测试的能力,过去需要第二名律师审查你的工作。现在在同一场对话里完成。
五、特权问题:律师都问的
每个问过AI的律师都在问。
简答:允许你把文件存在云存储、电子发现平台和在线法律研究数据库上使用的同一框架,同样适用。ABA指南和各州律师协会伦理意见将AI工具视作受代理/工具例外保护的技术提供商。你的义务是采取合理措施保护客户数据——在实践上意味着关闭输入用于模型训练的选项、理解服务商的数据处理方式、以及记录你的推理过程。
Anthropic提供了零数据保留的API选项和业务数据处理协议。你的客户数据不用于训练模型,输入不在会话之外存储。这和你把客户文件放进Dropbox、Google Drive或Clio之前进行的尽职调查是一样的。
Zack还多做了一步。他让Claude帮他在委托书中起草了一个AI使用条款。条款将AI定义为效率和质量增强工具,强调律师监督,将数据处理绑定到现有保密义务,并获取客户同意。客户签字时毫不眨眼。他们大多数默认他已经在用 AI。他们的假设是对的。
伦理规则在大多数司法管辖区已经要求技术能力。Zack的判断是直接且尖锐的:我们正在接近这样一个临界点——不使用这些工具,反而是更难以自我辩护的职业责任立场。
六、提示词即技能
大多数尝试AI的律师会输入"审查这份合同",得到一个平庸的回复。然后断定AI对法律工作没用。
问题不在AI。问题在输入。
对比一下。这是"审查这份合同"。这是"从供应商角度审查这份服务协议。标记客户在哪些地方将风险转移到了超出此类交易的市场惯例之外。检查是否缺失本应存在的条款——包括责任上限、知识产权所有权、数据处理和便利终止权。产出一份带严重程度评级的总结,每条高风险问题附上具体反制语言。注意供应商谈判筹码有限且希望快速完成交易,因此建议应聚焦于值得争取的条款和应该优雅让步的条款。"
第二个版本产出的工作成果,第一轮就能用。第一个版本产出的,即使有用也需要大量修改。"AI是个玩具"和"AI改变了我执业"之间的全部差距,存在于你指令的质量里。
这就是为什么技能如此重要:它们编码了这种详细程度,你写一次,它每次都自动生效。
七、这改变了什么
几件事值得被点名。
人员配置。 Zack经营一家两个人的律所,却承载了大得多的工作量。这是AI的直接结果。传统上需要招一名初级律师才合理的工作——第一轮文档审查、研究备忘录、初稿、修订对比摘要、日常通信——现在由Claude在他监督下完成。要清楚:每一份离开他律所的文件,都经过执业律师的审查、修改和批准。AI 产出首轮草稿。他产出最终工作成果。初级律师不会被淘汰。但从经济学上判断,什么时候该招一名初级律师的门槛已经上移了。 而且需要他们做什么已经变了:判断力、客户关系、AI产出的监督——而不是2000小时的文档生产。
计价。 AI改变了价值方程。对某些任务,节省的时间显而易见,他把节省传递给客户。对另一些任务,同样的小时数产出了比之前可能实现的更深得多的分析、更全面的问题发现和更高质量的起草。重点不是每项任务花的时间更少。而是每一小时律师时间产出了更多价值。
Zack的律所提供订阅定价和传统小时计费并行,取决于委托内容。订阅客户享受持续顾问、合同审查、合规监控和日常治理——固定月费。没有计费表在跑。AI让这个模式得以运行,因为他在可预测的费用结构内交付了更全面的服务。客户爱它——他们不怕拿起电话或发邮件。收入也可预测,而不是时多时少。
判断力。 上面描述的一切都制造了一种诱惑:让AI做太多。停止检查。研究结论是一致的:在 AI 能力范围之外使用 AI 的人,或信任 AI 却不审视其输出的人,表现比完全不用 AI 的人更差。
能靠这项技术胜出的律师,在最底层的认知上是清醒的:AI 不在从事法律执业。你是在从事法律执业。AI 让你更快、更彻底、更一致。但判断力——你决定为何而争为何而让的部分,你在字里行间读出那些没说出口的东西的部分,你做出一个可能左右两面的判断然后用自己的声誉压在上面的部分——那是你的。
有经验的律师在这个新世界里拿着巨大的优势,他们大多还没意识到。 如果你在执业领域已经花了十年或二十年发展判断力,你正坐在那个 AI 让它变得更加值钱的资产上,而不是贬值。
八、开始行动
Zack不为Anthropic工作。他只是一个执业律师,尝试了市面上所有的 AI 工具,然后围绕那个最好用的——对真实的他的工作方式而言最好用的——建立了自己的执业体系。
绝大部分律师使用 AI 的方式(在一个聊天框里输入一个问题然后寄希望于最好结果)和上文描述的东西之间的差距,是巨大的。弥合这个差距不需要技术能力。它需要投入几小时学习这个工具实际上怎么运作:Chat和Cowork的区别、为什么长而详细的提示词比短的效果好得多、怎么建一个编码你判断力的技能、怎么把技能打包成一个任何同事都能用的插件。
步骤:
下载桌面应用 选择你最常做的那个任务 写一条提示词,详细描述你希望它怎么做——不是"审查这份合同",而是你对一份好审查的所有具体要求 看它回来什么 迭代两次 把它存成技能 看复利曲线开始爬升
结尾:两条曲线,两种未来
在所有AI改造行业的叙事里,法律行业通常被描述成最后会变的那种——职业壁垒、监管保护、文字工作天然需要"人的判断"。Zack Shapiro的实战记录击穿了这个假设。
它暴露了两件事。
第一,法律AI产品的真正瓶颈不是模板不是判例库而是判断力编码。 一个律师最值钱的资产——经过多年实践积累的框架、触觉、本能——现在可以被写成一个技能文件,在每次相关场景中自动激活。这不是"AI 会替代律师"的故事。这是"懂得把自己的判断力教给 AI 的律师正在拉大跟不教的律师之间的差距"的故事。
第二,通用AI的"旁路攻击"。 当法律垂直产品还在争论怎么把聊天框嵌入文档编辑器时,通用前沿模型已经能直接在XML层级操控 .docx 文件了。这不是更好的法律搜索。这是更好的软件工程能力被重新应用于法律工作流。那些砸几百万美元融资做垂直法律 AI 的公司,正在面临的竞争不是彼此——是Anthropic、OpenAI这样的平台公司本身。
对中国的律师来说,这篇文章提供了一个比美国的语境更自由的切入点:国内律所的信息化建设比美国同行晚了一个时代,但在AI面前这是一个机会——你可以直接跳过老一代律所花十年建立的文档管理、知识管理、模板系统,直接进入 AI-native(AI原生)的执业模式。
一个律师、一台笔记本、六个技能文件。这就是一家完全能跟百人所正面竞争的产品交付单元。
不是说AI让律师变得多余。是说慢的律师会输给快的律师。不用 AI 的律师会输给把自己的十年判断力写成技能的律师。
参考资料
原文来自 Zack Shapiro @X 平台长文《The Claude-Native Law Firm》,2026 年 2 月。Zack Shapiro 是执业律师,经营一家两人精品律所,专注创业公司设立、风险投资交易和监管业务。https://x.com/zackbshapiro/status/2027389987444957625
推荐阅读
Claude法律行业落地指南:2026年AI如何重塑律师日常工作
Intuit GenOS实践:如何构建支持AI智能体的基础设施平台
AI时代工程领导力:当95%的AI试点失败时,我们到底该怎么做
夜雨聆风