法律人的AI学习框架:把复杂的事情变简单

前几天在一个法律人的微信群里，有人问了一个问题："现在AI工具太多了，到底该学哪个？"

底下瞬间炸了。

有人说学Kimi，有人说学豆包，有人说学ChatGPT，有人推荐各种插件，有人推荐各种Agent。每个人说的都不一样，每个人推荐的都不同。最后提问的人更懵了。

这个问题我见过太多次了。每次看到，我都会想：真正的问题不在于"学哪个工具"，而在于你有没有一个底层的认知框架。

没有框架的人，看到什么新东西都想去学，学了一堆，发现都是碎片，拼不起来。有框架的人，看到一个新工具，几秒钟就能判断它属于哪个环节、解决什么问题、值不值得花时间。

在AI的世界里，这个框架其实不复杂。就三个词：模型、数据、算力。

这不是什么高深的技术概念，而是你理解一切AI应用的底层地图。搞清楚了这三个东西的关系，你以后再看到任何AI产品、任何新功能、任何行业应用，都能一眼看穿它的本质。

模型：AI的"大脑"

先说模型。

模型是什么？通俗地说，模型就是AI的"大脑"。它是一个经过大量文本训练出来的数学系统，你给它输入一段文字，它就能基于它学过的知识，预测出接下来应该输出什么。

所有你在用的AI产品——Kimi、豆包、ChatGPT、Claude——背后都有一个模型在驱动。你看到的是界面的不同，但真正决定输出质量的是模型的能力。

很多人没看清的一点是：同一个问题，用不同的模型，答案的质量可能天差地别。

在我们的实验班里，有一次让大家写脚本。用较差的模型，写了三四遍都跑不通，改来改去各种报错。换了一个更好的模型，一遍就过了，直接能用。这不是夸张，这是每天都在发生的真实情况。

模型的能力，决定了AI输出的天花板。你可以通过更好的提示词、更好的数据来逼近这个天花板，但你永远无法突破它。如果一个模型本身能力不够，你怎么调教，它给出的答案质量都是有上限的。

那法律人需要关心哪些模型？

说实话，不需要关心太多。你只需要知道一个基本格局：目前全球最顶尖的通用模型，主要集中在中美两国的几个头部厂商。美国的"御三家"是OpenAI的GPT系列、Anthropic的Claude系列、谷歌的Gemini系列；国内比较强的有智谱的GLM、月之暗面的Kimi、MiniMax等。

每个模型都有自己的擅长领域和短板。有些模型写代码特别强，有些模型做中文理解更好，有些模型在长文本处理上有优势，有些模型推理能力更突出。你在实际使用中，会逐渐建立自己的判断——什么任务用什么模型效果最好。

但这里有一个很多人容易忽略的细节：你买的套餐不同，能用的模型也不同。同样是某个厂商的会员，基础套餐和高阶套餐能调用的模型可能完全不同。而且有些套餐是按次数计费的，有些是按token量计费的，有些模型算一次，有些模型算三次。这些细节直接影响你的使用成本和体验，值得花点时间去了解。

数据：AI的"养料"

再说数据。

如果说模型是大脑，那数据就是大脑的养料。一个模型再聪明，如果给它喂的数据质量很差，它输出的内容也不会好。

这一点，法律人的感受应该特别深。

你用AI帮你做法律研究，它去网上搜到的信息源是什么？可能是搜狐、百家号、今日头条这些质量参差不齐的自媒体内容。你让它帮你分析一个案件，它参考的裁判文书可能是十年前的过时案例。你让它帮你写一份合同审查意见，它用的标准可能是它自己预训练时学到的"一般性标准"，而不是你所在机构的内部规范。

这些都是数据质量问题。

而且这里还有一个很现实的问题：中国的互联网生态是巨头割据的。腾讯的内容百度搜不到，字节的内容搜不到，阿里的内容别人也抓不到。你用的模型是哪家的，很大程度上决定了它能搜到什么数据、搜不到什么数据。

真正的问题是：你不能控制AI的数据源。

在网页端或者APP端，你只能被动接受厂商给你提供的数据。但在第二层、第三层的应用方式里，你可以主动构建自己的数据体系。

什么意思？你可以把你工作中积累的权威资料——审判指导丛书、理解与适用系列、你所在领域的核心法规和案例——转换成AI喜欢的格式，建立自己的本地知识库。当AI需要参考信息时，优先从你的知识库里检索，而不是去互联网上随便搜。

你甚至可以写脚本，定期从特定网站获取最新的法规和规范性文件，自动更新你的知识库。财政部网站更新了新的部门规章？你的脚本自动获取、自动清洗、自动入库。下次你问AI相关问题时，它参考的就是最新的权威资料。

但这里有一个很多人容易陷入的误区：不是数据量越大越好。

有人觉得，我接一个全量的裁判文书数据库，AI的回答效果就一定更好。不一定。数据量太大，反而可能更不准。因为在检索的时候，它不可能把所有数据都读一遍——模型有上下文窗口的限制，它只能提取一部分"相关性最高"的片段来参考。如果数据量太大但质量参差不齐，它提取到的片段可能并不是最权威、最相关的，反而是一些历史性的、过时的裁判尺度。

真正有效的做法是：数据不在多，在于精。一个经过你人工筛选的、口径较小但质量更高的数据集，可能比一个全量但质量参差不齐的数据库，给你跑出来的结果更有可用性。

这跟做人其实是一个道理。你认识一百个人，大部分都是泛泛之交，关键时刻帮不上忙。不如认识十个真正靠谱的朋友，遇到什么事一个电话就能解决。

算力：AI的"能量"

最后说算力。

如果说模型是大脑，数据是养料，那算力就是让大脑运转的能量。没有算力，模型就是一个摆设，再聪明也发挥不出来。

对于法律人来说，你不需要理解算力的技术细节。你只需要理解一个核心概念：token。

Token是AI处理文本的基本单位。你可以粗略地把它理解为"词"或者"字"。你给AI输入一段文字，它处理这些文字、生成回答，整个过程消耗的就是token。你问的问题越长、你上传的文件越大、你要求的回答越详细，消耗的token就越多。

而token是要花钱的。

这就是为什么很多人用AI感觉"免费"——因为他们在用网页端，厂商承担了算力成本。但一旦你开始用更高级的应用方式——接入API、使用编程Agent——你就需要自己购买算力了。

购买算力的方式有很多。你可以直接向模型厂商买会员或者按量付费；你可以通过云厂商的平台购买，比如火山方舟、阿里百炼；你也可以通过中转站购买，这些平台集合了全球各种模型，按量计费。

每种方式都有不同的价格、不同的模型选择、不同的使用限制。比如有的套餐是按次数计费的，你调用一次高级模型就算一次，不管你问的问题简单还是复杂。这种套餐下，你用高级模型做一些简单的聊天，就非常浪费。有的套餐是按token量计费的，用多少扣多少，相对更灵活。

还有一个很多人没关注到的指标：并发。就是你在同一时间能同时运行多少个任务。有些套餐只支持一个并发，意味着你同时只能做一件事。如果你需要AI同时帮你处理多个任务，就需要关注这个指标。

说到算力，还有一个选择是本地化部署——把模型安装在自己的电脑上运行。好处是不需要网络、不消耗在线算力、数据不离开本地。但问题是本地能跑的模型参数量有限，能力跟云端最好的模型差距还比较大。目前更适合做一些轻量的、确定性的任务，比如格式转换、文本提取之类的。

真正的问题是，未来用AI的方式可能不是"永远用最好的模型做所有事"，而是像一个智能调度系统一样——根据任务的不同难度和类型，自动分配最合适的模型和算力。简单任务用便宜的小模型，复杂任务用贵的大模型，本地能解决的就不上云。这样才能在保证质量的前提下，把成本降到最低。

三要素之间的关系

理解了模型、数据、算力各自是什么，你还需要理解它们之间的关系。

模型决定了输出的上限，数据决定了输出的质量，算力决定了输出的成本和速度。三者缺一不可，但又不是简单的"哪个更重要"的关系。

一个能力很强的模型，如果没有好数据的支撑，它给出的答案也可能很差——这就是为什么很多人觉得"AI总是胡说八道"，很多时候不是模型不行，而是它参考的数据质量太差。

一个数据质量很高的知识库，如果配上一个能力很弱的模型，它也发挥不出应有的价值——就像你给了一个普通人一套顶级的法律工具书，他也不一定能做出高质量的法律分析。

而算力，则是连接模型和数据的桥梁。你有最好的模型和最好的数据，但如果算力不够——比如上下文窗口太小，装不下你的知识库——你也没办法充分利用它们。

所以，当你下次看到一个AI产品或者工具的时候，不要只看它"好不好用"。试着问自己三个问题：它用的是什么模型？它的数据从哪里来？它的算力成本怎么算？

能回答这三个问题，你就不再是一个"被产品牵着走"的用户，而是一个有判断力的使用者。

最后说一句

模型、数据、算力，这三个概念并不复杂。但真正理解它们之间的关系，并且能在实际工作中做出正确的选择，需要系统的学习和大量的实操。

你可以在各种渠道零散地获取碎片化的信息，但碎片化的信息拼不出系统化的能力。就像你看了几百个短视频，也学不会做菜一样。

如果你意识到自己需要的不只是"围观"，而是真正把AI变成工作中趁手的工具，那系统的训练比什么都重要。

"四明山法师AI夜校"就是为此而设计的。我们不讲空洞的趋势和概念，只讲一个法律人从零开始，怎么理解AI的底层逻辑，怎么上手实操，怎么在自己的工作场景里真正用起来。模型怎么选，数据怎么建，算力怎么管——每一个环节都有具体的方法和可操作的路径。

认知先行，能力跟上。这才是学AI的正确姿势。

作者简介

陈石律师，浙江海泰律师事务所副主任、高级合伙人、房地产与建设工程部主任，宁波市律师协会副秘书长、第七届宁波仲裁委员会仲裁员，聚焦建筑房地产、投融资、并购重组及商事争议解决。曾获多家法律媒体与专业机构认可，荣登 LegalOne 2025 中国区建工及房地产实务先锋 45 强、律新社2025年度管理合伙人20佳（华东），入选《商法》The A-List 法律精英，获评 ALB China 区域市场十五佳长三角地区律师新星，并获律新社 2024 年度并购领域品牌之星。长期为万科、华润置地、信达地产、保利置业、招商蛇口、中海地产等企业提供法律服务，承办首宗百亿地王长春第一高楼台州第一高楼等代表性项目，累计服务项目投资额超千亿。近年来持续推动 AI 与法律实务融合，强调以结构化方法打通技术逻辑、法律判断与商业场景；著有《赋能法律人：AI底层思维与应用范式》，并在多地开展相关主题讲座与分享。