你用的软件在教你做事,Agent 在学你做事

1. 你用的软件在教你做事，Agent 在学你做事

写这篇文章的起因，是我试着给自己搭了一个装修报价 Agent。

过程比我想的曲折，但跑通之后回头看，发现里面的设计思路其实可以迁移到很多行业——律师的合同模板、外贸的报价单、餐饮的成本核算……但凡"每家都有自己的玩法"的领域，都适用。

所以这不是一篇装修行业的技术文档。是一个"我怎么从一头雾水到想清楚 Agent 该怎么设计"的过程复盘。

2. 为什么装修报价这件事，SaaS 搞不定

装修报价有一个让软件公司绝望的特点：每家公司算钱的方式都不一样。

我翻了二十几份不同公司的报价单，差异比想象的大：

• 计价方式混着来。 贴砖按面积，橱柜按延米，开关插座按"点位"，强弱电箱移位按"项"一口价。五种计价逻辑共存于同一份报价单。

• 项目拆分粒度天差地别。 A 公司拆到螺丝钉——水泥砂浆、界面剂、人工铺贴分开列。B 公司直接一行"墙砖铺贴 55 元/㎡"全包。你能说谁对谁错？

• 材料品牌绑定在习惯里。 同一道"墙面乳胶漆"，有人默认立邦有人默认多乐士。单价差 20 块，不是谁黑心，是供应链不一样。

• 隐形规则藏在老板脑子里。 有一家公司"阳台防水"时有时无。翻了十几份才找到规律——阳台面积超过 4㎡才报防水，小阳台默认不报。这条规则不会写在任何地方。

传统软件公司的解法是：做一个超级灵活的配置后台，把计价方式、项目拆分、材料映射、触发规则全部做成可配置项。

结果呢？没人填。配置它比直接做报价还累。

这就引出了一个根本问题：当"统一标准"不存在的时候，你是让用户学你的系统，还是让系统学用户？

3. 核心思路反转：不让用户填配置，让 AI 从历史数据里"反向工程"

有一天我突然想通了一件事：

每家公司都已经有历史报价单了。那些 Excel 里就是他们规则的沉淀。为什么不直接读那些表？

传统软件的思路：


  
    
    
    
  
  bash
定义数据结构 → 用户填数据 → 系统输出结果

Agent 的思路：


  
    
    
    
  
  bash
用户给样本 → Agent 推断规则 → 用户纠正 → Agent 记住

区别在哪？前者要求用户把自己的知识翻译成系统能懂的格式。后者让用户用自己最舒服的方式表达，翻译的事交给 AI。

举一个具体的例子。一个装修老板过去三年攒了几十份报价 Excel，格式七七八八——同一道工序，有的写"墙砖铺贴"，有的写"墙面贴砖"，有的写"瓷砖铺贴（墙面）"。

传统做法：老板你先统一命名、分好类、对好单价，再导入系统。老板一听就烦了。

Agent 做法：AI 读完所有文件，跑来问：

我发现"墙砖铺贴"“墙面贴砖”"瓷砖铺贴（墙面）"这三个名字单价都在 50-55 元/㎡，工艺描述也相似。是不是同一个东西？

老板回一个"是"。三个名字合并，完事。

用户只做了一个决策，零数据录入。 这就是 Agent 和传统软件最本质的区别——Agent 把"认知负担"从用户转移到了模型身上。

4. 设计 Agent 最关键的机制：学习闭环

想清楚思路之后开始搭系统。这时候遇到了真正核心的设计问题：怎么让 Agent 越用越准？

我把整个流程拆成两个阶段：

入库阶段（认真做一次）。 历史报价全部丢进去 → AI 逐份扫描 → 模糊的地方主动提问 → 你逐一确认 → 形成专属知识库。

出表阶段（每次用）。 输入空间和面积 → AI 查库匹配模板 → 套公式填数字 → 不确定的地方标红 → 你只审红色。

但真正重要的设计在这句话里：

你改红色的过程，就是新一轮训练。

比如入库之后，AI 给新项目出报价，“阳台防水"标了红——因为历史数据里这个项目时有时无，AI 不确定该不该报。你把"阳台防水"从"不报"改成"报，12㎡”，AI 对比修改前后的差异，记下一条规则：该公司的阳台防水触发条件是"阳台面积超过 3㎡"。下次类似户型，自动打白不标红。

Agent 不是一交付就定型的产品。它在使用中成长。 用得越多，红色越少，从 80% 确定率升到 95%，再升到 98%。

这个闭环的设计，是 Agent 和传统软件在架构层面最大的不同——你需要的不只是"输入→输出"，而是"输入→输出→反馈→更新"的完整回路。

5. 信任机制：不追求 100% 自动，追求"不确定的让我知道"

一个设计师朋友跟我说了句话，让我想了很久：

“我不是不信 AI 算不对数。我是不信它理解我的规则。我宁可自己做，也不敢冒算错钱的风险。”

这句话点醒了我：信任问题不是准确率问题，是"不知道它什么时候会错"的问题。

所以我在报价表里设计了三级信任标记：

白色行——AI 确定。项目在库里确认过 5 次以上，单价最近一季度更新过。你跳过不看。

黄色行——条件触发。比如"地暖找平"取决于客户装不装地暖，AI 不知道所以标黄提醒你确认。

红色行——AI 不确定。可能是：空间类型历史出现太少、单价超过半年没更新、客户备注了特殊要求、或者这个项目在历史里时有时无。

一份三房两厅五六十个项目，真正标红标黄的通常不超过 10 个。5 分钟审完。

Agent 信任机制的核心就一句话：不假装全能。不确定的地方大声告诉你，让你只审不确定的。

这个设计思路其实跟自动驾驶的 L3 级别逻辑很像——系统处理常规场景，边缘场景主动交还人类。用户不是因为"AI 能做 100%"才信任它，而是因为"AI 知道什么时候该喊人"才敢用。

6. 四个通用原则：从装修报价到任何 Agent

做完这个项目之后我往回看，发现有些东西是可以复用的。写到这我自己都觉得接下来要列的东西有点太工整了——但它确实是先踩坑再总结出来的，不是先搭框架再填内容。不管你是想做律师的合同 Agent、外贸的报价 Agent、还是餐饮的成本 Agent，下面这四条应该都用得上。

▸ 原则一：从"差异点"开始设计，别从"通用点"开始

不要一上来就想数据库结构和系统架构。先收集至少 10 份真实的、不同来源的同类文件——合同、报价单、成本表，什么都行。然后逐份对比，找出差异点。

差异点才是 Agent 需要"学习"的东西。相同点直接写死在模板里就行了。

装修报价里相同点是什么？卫生间一定有防水、贴砖、吊顶。差异点是什么？计价方式、拆分粒度、材料默认品牌、隐形触发规则。Agent 的价值在差异点，不在相同点。

▸ 原则二：用"提问"替代"配置"

每发现一个差异点，别急着把它变成配置项。先问自己：这个差异，能不能让 AI 从历史数据里自动识别？识别不出来的时候，能不能用一个简单的是非题让用户确认？

一个好的 Agent，用户面对的不是表单和下拉框，而是选择题。

更准确地说——用户面对的不是界面，是对话。 Agent 主动问，用户被动答。这个交互方向和传统软件是反的。

▸ 原则三：设计"纠正即训练"的通道

Agent 第一次不可能 100% 对。关键不是你对了多少，而是用户纠正你之后，下次能不能记住。

这意味着系统架构里必须有一个反馈通道：用户改了输出 → 系统对比差异 → 更新规则库。这个通道不需要很复杂——我的实现就两步：对比修改前后的 Excel 提取被改动的单元格，找到对应的项目，更新数据库里的规则。

没有反馈通道的 Agent 不是 Agent，是带 AI 前缀的自动化脚本。

▸ 原则四：建立分级信任，承认不确定性

全自动是一个陷阱。不是技术上做不到，而是用户不敢用、不想用。

给你的 Agent 输出打上置信度标记——哪些是确定的、哪些是推断的、哪些需要确认。用户只审不确定的那一小部分。

7. 技术架构：推理、记忆、执行三者分离

最后一个值得聊的话题是技术选型。我踩了一遍坑之后发现，最舒服的架构模式是三件套：

推理层用大模型（Claude API / GPT API）。 读文件、理解规则、判断归类、生成提问、决策哪些行标红——所有需要"理解"的事都交给模型。它不操作文件，它只输出"该做什么"的指令。

记忆层用 SQLite 或 JSON。 用户确认过的规则、单价、公式、模板——需要持久化的东西放在结构化存储里。不要堆在 prompt 里，prompt 会越来越长而且不稳定。

执行层用 Python 脚本（OpenPyXL 之类）。 读模板、写单元格、标颜色、另存文件——这些确定性操作用传统代码。不要让模型直接生成 Excel 内容，格式永远不一样。

为什么这么分？因为三者需要的"稳定性"完全不同： • 推理需要灵活 → 大模型擅长

• 记忆需要准确 → 数据库擅长

• 执行需要可复现 → 代码擅长

混在一起就会出问题。让大模型直接生成 Excel 内容，格式每次都不同。让代码去判断"这个项目名是不是同一个东西的变体"，写死规则永远穷举不完。

每个组件做自己最擅长的事，Agent 才不会变成一团意大利面。

8. 一个今天就能开始的实验

如果你读完想动手试试，不需要一上来就搭完整系统。用 Claude Code CLI 跑通一个最小闭环就够了：

1. 找 3-5 份你行业的历史文件——合同、报价单、成本表都行——丢进项目文件夹。

2. 写一个 CLAUDE.md，用自然语言描述你的基本规则和模板结构。

3. 让 Claude Code 读这些文件，找出差异点，向你提问。你把答案写回规则文件。

4. 试跑一单新的，看 AI 能不能按你的规则填表。不对的地方手动改，改完记录为什么改。

5. 重复 3-4 几次，观察"红色"越来越少的过程。

跑通这个闭环，你就会有真实体感——AI 到底能替你干什么，哪里还需要你判断。这种体感比读教程值钱多了。

说实话，我第一次看到自己"训练"过的 Agent 自动把一份报价填到只标红了 3 行的时候，感觉挺奇妙的。不是"AI 好厉害"，而是——它在学我的规则。 我改过的东西它记住了，我没说过的它不乱猜。

这种体验一旦有过，就回不去传统软件了。不是因为 AI 更聪明，是因为它终于不再教你做事了。

📮 关注「AI信号实验室」，用 AI 重新理解你行业里的老问题。有想做的 Agent 方向？评论区告诉我，说不定下一期就是你的行业。