1. 你用的软件在教你做事,Agent 在学你做事
写这篇文章的起因,是我试着给自己搭了一个装修报价 Agent。
过程比我想的曲折,但跑通之后回头看,发现里面的设计思路其实可以迁移到很多行业——律师的合同模板、外贸的报价单、餐饮的成本核算……但凡"每家都有自己的玩法"的领域,都适用。
所以这不是一篇装修行业的技术文档。是一个"我怎么从一头雾水到想清楚 Agent 该怎么设计"的过程复盘。
2. 为什么装修报价这件事,SaaS 搞不定
装修报价有一个让软件公司绝望的特点:每家公司算钱的方式都不一样。
我翻了二十几份不同公司的报价单,差异比想象的大:
• 计价方式混着来。 贴砖按面积,橱柜按延米,开关插座按"点位",强弱电箱移位按"项"一口价。五种计价逻辑共存于同一份报价单。
• 项目拆分粒度天差地别。 A 公司拆到螺丝钉——水泥砂浆、界面剂、人工铺贴分开列。B 公司直接一行"墙砖铺贴 55 元/㎡"全包。你能说谁对谁错?
• 材料品牌绑定在习惯里。 同一道"墙面乳胶漆",有人默认立邦有人默认多乐士。单价差 20 块,不是谁黑心,是供应链不一样。
• 隐形规则藏在老板脑子里。 有一家公司"阳台防水"时有时无。翻了十几份才找到规律——阳台面积超过 4㎡ 才报防水,小阳台默认不报。这条规则不会写在任何地方。
传统软件公司的解法是:做一个超级灵活的配置后台,把计价方式、项目拆分、材料映射、触发规则全部做成可配置项。
结果呢?没人填。配置它比直接做报价还累。
这就引出了一个根本问题:当"统一标准"不存在的时候,你是让用户学你的系统,还是让系统学用户?
3. 核心思路反转:不让用户填配置,让 AI 从历史数据里"反向工程"
有一天我突然想通了一件事:
每家公司都已经有历史报价单了。那些 Excel 里就是他们规则的沉淀。为什么不直接读那些表?
传统软件的思路:
bash
定义数据结构 → 用户填数据 → 系统输出结果
Agent 的思路:
bash
用户给样本 → Agent 推断规则 → 用户纠正 → Agent 记住
区别在哪?前者要求用户把自己的知识翻译成系统能懂的格式。后者让用户用自己最舒服的方式表达,翻译的事交给 AI。
举一个具体的例子。一个装修老板过去三年攒了几十份报价 Excel,格式七七八八——同一道工序,有的写"墙砖铺贴",有的写"墙面贴砖",有的写"瓷砖铺贴(墙面)"。
传统做法:老板你先统一命名、分好类、对好单价,再导入系统。老板一听就烦了。
Agent 做法:AI 读完所有文件,跑来问:
我发现"墙砖铺贴"“墙面贴砖”"瓷砖铺贴(墙面)"这三个名字单价都在 50-55 元/㎡,工艺描述也相似。是不是同一个东西?
老板回一个"是"。三个名字合并,完事。
用户只做了一个决策,零数据录入。 这就是 Agent 和传统软件最本质的区别——Agent 把"认知负担"从用户转移到了模型身上。

4. 设计 Agent 最关键的机制:学习闭环
想清楚思路之后开始搭系统。这时候遇到了真正核心的设计问题:怎么让 Agent 越用越准?
我把整个流程拆成两个阶段:
入库阶段(认真做一次)。 历史报价全部丢进去 → AI 逐份扫描 → 模糊的地方主动提问 → 你逐一确认 → 形成专属知识库。
出表阶段(每次用)。 输入空间和面积 → AI 查库匹配模板 → 套公式填数字 → 不确定的地方标红 → 你只审红色。
但真正重要的设计在这句话里:
你改红色的过程,就是新一轮训练。
比如入库之后,AI 给新项目出报价,“阳台防水"标了红——因为历史数据里这个项目时有时无,AI 不确定该不该报。你把"阳台防水"从"不报"改成"报,12㎡”,AI 对比修改前后的差异,记下一条规则:该公司的阳台防水触发条件是"阳台面积超过 3㎡"。下次类似户型,自动打白不标红。
Agent 不是一交付就定型的产品。它在使用中成长。 用得越多,红色越少,从 80% 确定率升到 95%,再升到 98%。
这个闭环的设计,是 Agent 和传统软件在架构层面最大的不同——你需要的不只是"输入→输出",而是"输入→输出→反馈→更新"的完整回路。

5. 信任机制:不追求 100% 自动,追求"不确定的让我知道"
一个设计师朋友跟我说了句话,让我想了很久:
“我不是不信 AI 算不对数。我是不信它理解我的规则。我宁可自己做,也不敢冒算错钱的风险。”
这句话点醒了我:信任问题不是准确率问题,是"不知道它什么时候会错"的问题。
所以我在报价表里设计了三级信任标记:
白色行——AI 确定。项目在库里确认过 5 次以上,单价最近一季度更新过。你跳过不看。
黄色行——条件触发。比如"地暖找平"取决于客户装不装地暖,AI 不知道所以标黄提醒你确认。
红色行——AI 不确定。可能是:空间类型历史出现太少、单价超过半年没更新、客户备注了特殊要求、或者这个项目在历史里时有时无。
一份三房两厅五六十个项目,真正标红标黄的通常不超过 10 个。5 分钟审完。
Agent 信任机制的核心就一句话:不假装全能。不确定的地方大声告诉你,让你只审不确定的。
这个设计思路其实跟自动驾驶的 L3 级别逻辑很像——系统处理常规场景,边缘场景主动交还人类。用户不是因为"AI 能做 100%"才信任它,而是因为"AI 知道什么时候该喊人"才敢用。

6. 四个通用原则:从装修报价到任何 Agent
做完这个项目之后我往回看,发现有些东西是可以复用的。写到这我自己都觉得接下来要列的东西有点太工整了——但它确实是先踩坑再总结出来的,不是先搭框架再填内容。不管你是想做律师的合同 Agent、外贸的报价 Agent、还是餐饮的成本 Agent,下面这四条应该都用得上。
▸ 原则一:从"差异点"开始设计,别从"通用点"开始
不要一上来就想数据库结构和系统架构。先收集至少 10 份真实的、不同来源的同类文件——合同、报价单、成本表,什么都行。然后逐份对比,找出差异点。
差异点才是 Agent 需要"学习"的东西。相同点直接写死在模板里就行了。
装修报价里相同点是什么?卫生间一定有防水、贴砖、吊顶。差异点是什么?计价方式、拆分粒度、材料默认品牌、隐形触发规则。Agent 的价值在差异点,不在相同点。
▸ 原则二:用"提问"替代"配置"
每发现一个差异点,别急着把它变成配置项。先问自己:这个差异,能不能让 AI 从历史数据里自动识别?识别不出来的时候,能不能用一个简单的是非题让用户确认?
一个好的 Agent,用户面对的不是表单和下拉框,而是选择题。
更准确地说——用户面对的不是界面,是对话。 Agent 主动问,用户被动答。这个交互方向和传统软件是反的。
▸ 原则三:设计"纠正即训练"的通道
Agent 第一次不可能 100% 对。关键不是你对了多少,而是用户纠正你之后,下次能不能记住。
这意味着系统架构里必须有一个反馈通道:用户改了输出 → 系统对比差异 → 更新规则库。这个通道不需要很复杂——我的实现就两步:对比修改前后的 Excel 提取被改动的单元格,找到对应的项目,更新数据库里的规则。
没有反馈通道的 Agent 不是 Agent,是带 AI 前缀的自动化脚本。
▸ 原则四:建立分级信任,承认不确定性
全自动是一个陷阱。不是技术上做不到,而是用户不敢用、不想用。
给你的 Agent 输出打上置信度标记——哪些是确定的、哪些是推断的、哪些需要确认。用户只审不确定的那一小部分。
7. 技术架构:推理、记忆、执行三者分离
最后一个值得聊的话题是技术选型。我踩了一遍坑之后发现,最舒服的架构模式是三件套:
推理层用大模型(Claude API / GPT API)。 读文件、理解规则、判断归类、生成提问、决策哪些行标红——所有需要"理解"的事都交给模型。它不操作文件,它只输出"该做什么"的指令。
记忆层用 SQLite 或 JSON。 用户确认过的规则、单价、公式、模板——需要持久化的东西放在结构化存储里。不要堆在 prompt 里,prompt 会越来越长而且不稳定。
执行层用 Python 脚本(OpenPyXL 之类)。 读模板、写单元格、标颜色、另存文件——这些确定性操作用传统代码。不要让模型直接生成 Excel 内容,格式永远不一样。
为什么这么分?因为三者需要的"稳定性"完全不同: • 推理需要灵活 → 大模型擅长
• 记忆需要准确 → 数据库擅长
• 执行需要可复现 → 代码擅长
混在一起就会出问题。让大模型直接生成 Excel 内容,格式每次都不同。让代码去判断"这个项目名是不是同一个东西的变体",写死规则永远穷举不完。
每个组件做自己最擅长的事,Agent 才不会变成一团意大利面。

8. 一个今天就能开始的实验
如果你读完想动手试试,不需要一上来就搭完整系统。用 Claude Code CLI 跑通一个最小闭环就够了:
1. 找 3-5 份你行业的历史文件——合同、报价单、成本表都行——丢进项目文件夹。
2. 写一个 CLAUDE.md,用自然语言描述你的基本规则和模板结构。
3. 让 Claude Code 读这些文件,找出差异点,向你提问。你把答案写回规则文件。
4. 试跑一单新的,看 AI 能不能按你的规则填表。不对的地方手动改,改完记录为什么改。
5. 重复 3-4 几次,观察"红色"越来越少的过程。
跑通这个闭环,你就会有真实体感——AI 到底能替你干什么,哪里还需要你判断。这种体感比读教程值钱多了。
说实话,我第一次看到自己"训练"过的 Agent 自动把一份报价填到只标红了 3 行的时候,感觉挺奇妙的。不是"AI 好厉害",而是——它在学我的规则。 我改过的东西它记住了,我没说过的它不乱猜。
这种体验一旦有过,就回不去传统软件了。不是因为 AI 更聪明,是因为它终于不再教你做事了。
📮 关注「AI信号实验室」,用 AI 重新理解你行业里的老问题。 有想做的 Agent 方向?评论区告诉我,说不定下一期就是你的行业。
夜雨聆风