我让5款AI写同一份起诉状
3款的法条引用存在致命错误
余正洪 | 律见法度
2026年5月
做律师15年,我越来越觉得:AI对律师来说,不是"要不要用"的问题,而是"怎么用才不翻车"的问题。
过去半年,我把市面上能找到的5款法律AI工具全部实测了一遍。测试方法很简单,也很残酷:拿我正在办理的一起真实案件,让每款AI各写一份起诉状,然后我逐条核实它们引用的法条和案例。
结果让我后背发凉:5款AI里,有3款输出的法条引用存在明显错误——有的引用了已经废止的司法解释,有的把法条序号写对但内容完全不对,最离谱的一款,直接编造了一条看起来非常专业的"法律依据"。
这篇文章,是我实测后的完整记录。不吹不黑,只说真实体验。如果你也在用AI,或者打算用AI,建议你认真读完。
──────────────────────
一、我实测的5款工具
为了保证测评的客观性,我选了5款律师圈讨论最多、实际使用人数最多的工具,逐一进行横向对比:
① 北大法宝(AI增强版)——老牌法律数据库,近期接入了AI问答功能;② 元典智库——裁判文书深度分析工具,提供API接口,可做批量分析;③ ChatGPT(GPT-4o)——通用大模型,目前律师个人使用最广泛的AI;④ 律呗——国产法律垂直大模型,主打中文法律场景;⑤ 秘塔AI搜索——专注法律检索的AI工具,无需特殊网络环境即可使用。
测评维度共四项:法律检索准确率、文书起草质量、合同审查能力、综合使用成本。每个维度我用同一个真实案件测试,保证横向可比性。案件背景:一起股东损害债权人利益纠纷案,涉及公司法第二十条第三款的适用。
二、分项实测:谁擅长什么,谁不擅长什么
【维度一】法律检索准确率
测试方法:让每款工具检索"公司法第二十条第三款在执行追加程序中的适用条件",要求提供法条原文、相关司法解释和类案裁判要旨。
结果排序(准确率从高到低):北大法宝(AI增强版)> 元典智库 > 秘塔AI > 律呗 > ChatGPT。
北大法宝准确率最高,根本原因是:它不直接让AI"检索",而是用AI归纳已有权威数据库中的检索结果,从根本上规避了"幻觉"问题。ChatGPT垫底,测试中它编造了一条关于"执行追加一人公司"的司法解释,引用格式完全正确,但内容纯属生成——如果我没核实就引用,后果不堪设想。
警示: 用通用大模型做法律检索,必须逐条核实出处,否则执业风险极高。
【维度二】文书起草质量
测试方法:以我正在办理的股东损害债权人利益纠纷案为事实背景,让每款工具起草一份《民事起诉状》,要求包含完整的诉讼请求、事实理由和法律依据。
结果排序:ChatGPT > 律呗 > 元典智库 > 秘塔AI > 北大法宝。
ChatGPT的文书框架最完整、逻辑链条最清晰,诉讼请求的表述也最接近真实法庭用语。但它引用的法条需要人工逐条核实——这是所有通用大模型的共性问题。律呗作为国产法律垂直模型,对中文法律文书的格式把握最好,但在复杂法律关系的分析深度上,不如通用大模型。
建议: 文书起草用AI生成初稿,但法条引用必须人工逐条核对,切勿直接提交法院。
【维度三】合同审查能力
测试方法:上传一份真实的《股权转让协议》文本,让每款工具标注法律风险点,并按风险等级(高/中/低)分类输出审查意见。
结果排序:元典智库 > ChatGPT > 律呗 > 秘塔AI > 北大法宝。
元典智库在合同审查上表现最好,它能结合裁判文书大数据,告诉你"这类条款在司法实践中被认定无效或产生争议的概率是多少"。这是其他工具目前做不到的——它们只能做文本层面的风险标注,而元典智库能做到"数据驱动"的风险预测。北大法宝的合同审查功能目前还比较基础,暂不推荐用于正式业务。
【维度四】综合使用成本(金钱+时间)
金钱成本:北大法宝最贵,采用年费制,标准版约3000元/年;ChatGPT Plus约20美元/月(约合人民币150元/月);律呗、元典智库按次计费,单次检索约2-5元;秘塔AI目前有免费额度,付费版约99元/月。(具体价格以各平台官网为准,此处为2026年5月实测参考价。)
时间成本:通用大模型(ChatGPT)响应最快,几乎实时,但输出后的核实时间最长——因为你需要逐条验证它给的法条和案例。垂直法律AI响应稍慢,但输出内容更接近"可直接使用"的状态,核实时间短。
结论: 如果你是初级律师或独立执业律师,时间比金钱贵,建议选垂直法律AI(元典/律呗);如果你是有经验的律师且具备核实能力,选通用大模型+人工核实,性价比更高。

──────────────────────
三、5款工具总评:谁适合你?
分项测试做完后,我按"适合人群"整理了一张决策表(见文末附表2),这里先说核心结论:没有任何一款工具是"万能"的。
我自己目前的工作方案是:北大法宝做权威法规检索 + ChatGPT做文书初稿起草 + 元典智库做合同审查和类案分析。三款工具组合使用、各取所长,这才是律师用AI的正确姿势。
如果你的预算只允许选一款,我的建议是:做法规检索为主的选北大法宝;做文书起草最多的选ChatGPT;做合同审查最多的选元典智库。先看自己的主要痛点,再选工具。

四、律师使用AI的三大误区
误区一:"AI这么聪明,我可以直接用它的结论"
这是最危险的误区,没有之一。AI的"幻觉"问题在法律场景下后果可能非常严重——你引用了一条不存在的法条或已经废止的司法解释,对方律师一核实就露馅,轻则法庭上尴尬,重则可能因"提供错误信息"承担执业责任。
正确做法:AI给的任何法条、案例、司法解释,必须逐条核实原件。我给自己定的规矩是:AI输出的法条,每一条都要在北大法宝或官方法律数据库里核对一遍,确认条文序号、生效日期、适用范围全部正确,才敢写进正式文书。
误区二:"AI会替代律师,所以我不用学,免得被它抢饭碗"
这个想法恰恰搞反了。AI替代的是"低阶法律工作"(案情摘要、标准文书起草、形式审查),但"高阶法律工作"(策略判断、庭审辩论、客户沟通、复杂案件方案设计)是AI短期乃至中期内都无法替代的。
不用AI的律师不会被AI替代,但会被"会用AI的律师"逐步边缘化——因为后者效率更高、响应更快、客户服务体验更好,客户没有理由为一个"不用工具、事事慢半拍"的律师支付溢价。
误区三:"法律AI工具都差不多,随便选一个就行"
不同工具的"能力边界"差异极大,用错了工具,效率不升反降。比如:做法律检索,应该选有权威数据库背书的工具(北大法宝、秘塔AI);做文书起草,可以选通用大模型(ChatGPT、律呗);做合同审查,优先选有司法大数据支撑的工具(元典智库)。
选工具之前,先想清楚你要用它解决什么具体问题,再看哪款工具在这个具体场景下的实测表现最好。盲目跟风只会浪费时间和金钱。

──────────────────────
五、给同行的实操建议:如何安全地开始用AI?
如果你还没有开始用AI,我的建议是:从一件最小的事开始,不要试图"全面AI化"。那样只会让你更焦虑,最终半途而废。
第一步:选一个你最痛苦的工作环节(比如"写案情摘要太费时间"或"合同审查太慢")。第二步:选一款对应该场景的AI工具,只用来做这一件事,用满一个月。第三步:记录效率提升了多少、出现了哪些问题、问题能否通过优化提示词解决。如果确实有效,再逐步扩展到其他工作环节。
AI不是魔法,它是一个需要学习、需要磨合、需要建立使用规范的工具。但一旦你找到了适合自己的使用方法,它给你带来的效率提升,会让你再也回不去"纯人工"的工作状态。
结 语
本文作者:余正洪律师,江苏无锡执业律师,执业15年。"律见法度"公众号主理人,专注公司法与股权纠纷,正在探索法律AI在实务中的落地应用。
夜雨聆风