我ji让5款AI写同一份起诉状3款的法条引用存在致命错误

我让5款AI写同一份起诉状

3款的法条引用存在致命错误

余正洪 | 律见法度

2026年5月

做律师15年，我越来越觉得：AI对律师来说，不是"要不要用"的问题，而是"怎么用才不翻车"的问题。

过去半年，我把市面上能找到的5款法律AI工具全部实测了一遍。测试方法很简单，也很残酷：拿我正在办理的一起真实案件，让每款AI各写一份起诉状，然后我逐条核实它们引用的法条和案例。

结果让我后背发凉：5款AI里，有3款输出的法条引用存在明显错误——有的引用了已经废止的司法解释，有的把法条序号写对但内容完全不对，最离谱的一款，直接编造了一条看起来非常专业的"法律依据"。

这篇文章，是我实测后的完整记录。不吹不黑，只说真实体验。如果你也在用AI，或者打算用AI，建议你认真读完。

──────────────────────

一、我实测的5款工具

为了保证测评的客观性，我选了5款律师圈讨论最多、实际使用人数最多的工具，逐一进行横向对比：

① 北大法宝（AI增强版）——老牌法律数据库，近期接入了AI问答功能；② 元典智库——裁判文书深度分析工具，提供API接口，可做批量分析；③ ChatGPT（GPT-4o）——通用大模型，目前律师个人使用最广泛的AI；④ 律呗——国产法律垂直大模型，主打中文法律场景；⑤ 秘塔AI搜索——专注法律检索的AI工具，无需特殊网络环境即可使用。

测评维度共四项：法律检索准确率、文书起草质量、合同审查能力、综合使用成本。每个维度我用同一个真实案件测试，保证横向可比性。案件背景：一起股东损害债权人利益纠纷案，涉及公司法第二十条第三款的适用。

二、分项实测：谁擅长什么，谁不擅长什么

【维度一】法律检索准确率

测试方法：让每款工具检索"公司法第二十条第三款在执行追加程序中的适用条件"，要求提供法条原文、相关司法解释和类案裁判要旨。

结果排序（准确率从高到低）：北大法宝（AI增强版）＞元典智库＞秘塔AI ＞律呗＞ ChatGPT。

北大法宝准确率最高，根本原因是：它不直接让AI"检索"，而是用AI归纳已有权威数据库中的检索结果，从根本上规避了"幻觉"问题。ChatGPT垫底，测试中它编造了一条关于"执行追加一人公司"的司法解释，引用格式完全正确，但内容纯属生成——如果我没核实就引用，后果不堪设想。

警示：用通用大模型做法律检索，必须逐条核实出处，否则执业风险极高。

【维度二】文书起草质量

测试方法：以我正在办理的股东损害债权人利益纠纷案为事实背景，让每款工具起草一份《民事起诉状》，要求包含完整的诉讼请求、事实理由和法律依据。

结果排序：ChatGPT ＞律呗＞元典智库＞秘塔AI ＞北大法宝。

ChatGPT的文书框架最完整、逻辑链条最清晰，诉讼请求的表述也最接近真实法庭用语。但它引用的法条需要人工逐条核实——这是所有通用大模型的共性问题。律呗作为国产法律垂直模型，对中文法律文书的格式把握最好，但在复杂法律关系的分析深度上，不如通用大模型。

建议：文书起草用AI生成初稿，但法条引用必须人工逐条核对，切勿直接提交法院。

【维度三】合同审查能力

测试方法：上传一份真实的《股权转让协议》文本，让每款工具标注法律风险点，并按风险等级（高/中/低）分类输出审查意见。

结果排序：元典智库＞ ChatGPT ＞律呗＞秘塔AI ＞北大法宝。

元典智库在合同审查上表现最好，它能结合裁判文书大数据，告诉你"这类条款在司法实践中被认定无效或产生争议的概率是多少"。这是其他工具目前做不到的——它们只能做文本层面的风险标注，而元典智库能做到"数据驱动"的风险预测。北大法宝的合同审查功能目前还比较基础，暂不推荐用于正式业务。

【维度四】综合使用成本（金钱+时间）

金钱成本：北大法宝最贵，采用年费制，标准版约3000元/年；ChatGPT Plus约20美元/月（约合人民币150元/月）；律呗、元典智库按次计费，单次检索约2-5元；秘塔AI目前有免费额度，付费版约99元/月。（具体价格以各平台官网为准，此处为2026年5月实测参考价。）

时间成本：通用大模型（ChatGPT）响应最快，几乎实时，但输出后的核实时间最长——因为你需要逐条验证它给的法条和案例。垂直法律AI响应稍慢，但输出内容更接近"可直接使用"的状态，核实时间短。

结论：如果你是初级律师或独立执业律师，时间比金钱贵，建议选垂直法律AI（元典/律呗）；如果你是有经验的律师且具备核实能力，选通用大模型+人工核实，性价比更高。

──────────────────────

三、5款工具总评：谁适合你？

分项测试做完后，我按"适合人群"整理了一张决策表（见文末附表2），这里先说核心结论：没有任何一款工具是"万能"的。

我自己目前的工作方案是：北大法宝做权威法规检索 + ChatGPT做文书初稿起草 + 元典智库做合同审查和类案分析。三款工具组合使用、各取所长，这才是律师用AI的正确姿势。

如果你的预算只允许选一款，我的建议是：做法规检索为主的选北大法宝；做文书起草最多的选ChatGPT；做合同审查最多的选元典智库。先看自己的主要痛点，再选工具。

四、律师使用AI的三大误区

误区一："AI这么聪明，我可以直接用它的结论"

这是最危险的误区，没有之一。AI的"幻觉"问题在法律场景下后果可能非常严重——你引用了一条不存在的法条或已经废止的司法解释，对方律师一核实就露馅，轻则法庭上尴尬，重则可能因"提供错误信息"承担执业责任。

正确做法：AI给的任何法条、案例、司法解释，必须逐条核实原件。我给自己定的规矩是：AI输出的法条，每一条都要在北大法宝或官方法律数据库里核对一遍，确认条文序号、生效日期、适用范围全部正确，才敢写进正式文书。

误区二："AI会替代律师，所以我不用学，免得被它抢饭碗"

这个想法恰恰搞反了。AI替代的是"低阶法律工作"（案情摘要、标准文书起草、形式审查），但"高阶法律工作"（策略判断、庭审辩论、客户沟通、复杂案件方案设计）是AI短期乃至中期内都无法替代的。

不用AI的律师不会被AI替代，但会被"会用AI的律师"逐步边缘化——因为后者效率更高、响应更快、客户服务体验更好，客户没有理由为一个"不用工具、事事慢半拍"的律师支付溢价。

误区三："法律AI工具都差不多，随便选一个就行"

不同工具的"能力边界"差异极大，用错了工具，效率不升反降。比如：做法律检索，应该选有权威数据库背书的工具（北大法宝、秘塔AI）；做文书起草，可以选通用大模型（ChatGPT、律呗）；做合同审查，优先选有司法大数据支撑的工具（元典智库）。

选工具之前，先想清楚你要用它解决什么具体问题，再看哪款工具在这个具体场景下的实测表现最好。盲目跟风只会浪费时间和金钱。

──────────────────────

五、给同行的实操建议：如何安全地开始用AI？

如果你还没有开始用AI，我的建议是：从一件最小的事开始，不要试图"全面AI化"。那样只会让你更焦虑，最终半途而废。

第一步：选一个你最痛苦的工作环节（比如"写案情摘要太费时间"或"合同审查太慢"）。第二步：选一款对应该场景的AI工具，只用来做这一件事，用满一个月。第三步：记录效率提升了多少、出现了哪些问题、问题能否通过优化提示词解决。如果确实有效，再逐步扩展到其他工作环节。

AI不是魔法，它是一个需要学习、需要磨合、需要建立使用规范的工具。但一旦你找到了适合自己的使用方法，它给你带来的效率提升，会让你再也回不去"纯人工"的工作状态。

结语

本文作者：余正洪律师，江苏无锡执业律师，执业15年。"律见法度"公众号主理人，专注公司法与股权纠纷，正在探索法律AI在实务中的落地应用。