我听完这场 Agent 讨论,觉得软件要重写了-夜雨聆风

我听完这场 Agent 讨论,觉得软件要重写了

最近听了一段关于 AI Agents 发展的讨论，信息量很大。

但我不想把它写成一篇“观点汇总”。

因为这段讨论真正有价值的地方，不是每个人分别说了什么，而是它最后指向了一个更大的判断：

【核心结论】 AI Agent 的下一阶段，不是做出更多会聊天、会点鼠标的助手，而是倒逼软件系统本身被重写一遍。

换句话说， Agent 不是给旧软件贴一层 AI 皮，而是会让 SaaS 、 API 、数据、权限、工作流、组织协作都重新长一遍。

我一开始也容易把 Agent 理解成“更聪明的自动化工具”。但听到后面，我觉得这个理解太窄了。真正的问题不是“Agent 会不会替我点按钮”，而是：如果软件未来不仅给人用，也要给 Agent 用，那软件应该怎么设计？

这篇文章就围绕这个结论展开。

1. Agent 现在卡住的，不是一个 prompt 问题

【支撑判断 1 】今天 Agent 最大的瓶颈，不只是模型不够聪明，而是执行失败率、黑盒过程、速度、成本、兼容性和安全问题。

这点特别现实。

我们现在看一个 Agent ，常常先问：“它背后用的是哪个模型？ Claude 还是别的？推理能力强不强？”

但真正放到工作里，问题马上变成另一套：

它能不能稳定跑完任务？失败了能不能知道失败在哪里？中间过程是不是可观察？速度够不够快？一次任务成本多少？在 Windows 、本地软件、复杂 SaaS 里能不能装、能不能跑？权限怎么控制？如果它改错代码、写错数据、触发线上事故，谁来负责？

这些问题听起来没有“模型能力”那么性感，但它们才决定 Agent 能不能进真实业务。

个人玩一玩，失败了可以重试。企业里用，失败就是成本，误操作就是风险，黑盒就是没人敢托付。

所以这段讨论让我更确定一件事： Agent 的竞争不会只停留在模型层。模型当然重要，但从 Demo 走向业务，关键是执行系统。

2. 真正关键的是 Agent OS

【支撑判断 2 】模型像大脑， Agent OS 像操作系统。模型理解意图， Agent OS 负责拆任务、调度资源、管理权限、记录过程和协调多个 Agent 。

讨论里反复出现一个词： Agent OS 。

我自己的理解是，它不是传统意义上的 Windows 、 macOS ，也不是一个普通 App 。它更像 AI 工作流上方长出来的一层“任务操作系统”。

比如我说：“帮我整理这周销售数据，找出异常，并写一份汇报。”

模型能理解我要什么。但如果让模型自己一路硬干到底，它就会遇到很多问题：去哪查数据？用哪个接口？有没有权限？异常怎么定义？要不要让另一个 Agent 生成图表？最后能不能自动提交？失败了怎么重试？

这些都不是一句 prompt 能解决的。

Agent OS 要做的，就是把“聪明的大脑”变成“能稳定干活的系统”：

•把目标拆成任务；

•选择合适工具和数据；

•调度不同子 Agent ；

•管理权限和执行边界；

•记录过程，方便复盘；

•失败后重试、降级或交给人；

•让多个 Agent 之间可以通信。

所以我现在更愿意把 Agent 看成一个系统，而不是一个聊天窗口。

没有 Agent OS ， Agent 容易停留在 Demo ；有了 Agent OS ，它才可能进入公司流程。

3. SaaS 会被重新设计

【支撑判断 3 】未来 SaaS 不能只面向人类 UI ，还要面向 Agent 暴露 API 、结构化数据、业务规则和权限能力。

这是我听完后最强烈的感受。

今天的 SaaS ，本质上是围绕人设计的。人打开页面，人看表格，人点按钮，人填表单，人确认提交。

但 Agent 不是人。

让 Agent 看屏幕、点按钮、学录屏，当然能解决一部分问题。但这更像过渡方案。

它解决的是“眼前能不能跑”。真正长期要解决的是“能不能稳定、低成本、可控地跑”。

这就要求 SaaS 自己发生变化。

未来一个适合 Agent 的 SaaS ，可能要同时具备几层：

•UI 层：继续给人使用；

•API 层：给 Agent 直接调用；

•数据层：用结构化方式表达业务对象；

•知识层：让 Agent 理解业务规则、流程约束和异常处理；

•权限层：控制 Agent 在什么场景下能做什么；

•日志层：记录 Agent 做过什么，方便审计和回滚。

以前产品经理可能主要关心“这个页面好不好用”。以后还要多问一句：“这个系统， Agent 好不好用？”

这不是在页面上加一个 AI 按钮。

这是软件底层要重新整理。

4. Skill 的价值，是把经验变成可复用能力

【支撑判断 4 】 Tool 更像机器可调用的插件/API ， Skill 更像人类可读的经验包、流程脚本和知识说明书。

这段讨论里还有一个很重要的区分： Skills 和 Tools 不是一回事。

Tool 更像机器接口。比如搜索、查数据库、调用图片生成、发送公众号草稿、执行脚本。这类东西标准、明确、适合程序调用。

Skill 更像“怎么把这件事做好”的说明书。它可以包含流程、经验、示例、脚本、注意事项、风格要求，甚至是一个人多年工作方法的压缩包。

比如一个写公众号的 skill ，不应该只是“调用微信 API”。它还应该知道怎么选题、怎么开头、怎么组织观点、怎么配图、怎么写摘要、怎么避免 AI 味太重。

这也是我最近越来越有感触的地方。

Skill 最有意思的地方不是“自动”，而是“沉淀”。团队里真正值钱的经验，很多时候藏在老手的判断、顺序、取舍和检查清单里。 Skill 如果能把这些东西沉淀下来，它就不是一个提示词，而是一套可复用的工作方法。

所以， Agent 时代的能力建设，不只是多接几个工具，还要把人的经验写成 Agent 能理解、能执行、能复用的 skill 。

5. 真 Agent 不是旧工作流套一层 LLM

【支撑判断 5 】真正的 Agent ，不应该只是把人工 workflow 包一层 LLM ，而是让模型理解业务目标，再由 Agent OS 编排执行。

过去很多“智能体”，其实更像旧工作流升级版。

人先写好流程：第一步查数据，第二步填表，第三步生成报告，第四步发消息。 LLM 只是负责其中某一段理解或生成。

这当然有价值，但它不是 Agent 的最终形态。

旧工作流是：人把流程写死，机器照做。

新 Agent 应该是：人给目标和边界，模型理解业务意图， Agent OS 组织执行。

这里要注意，我不是说业务规则不重要。

恰恰相反，业务规则会变得更重要。模型不会凭空知道一家公司的数据口径、审批规则、岗位职责和异常流程。企业必须把这些知识、数据、权限边界整理出来，放进 Agent 能调用的资源层。

所以 Agent 的落地，不是“买个模型就行”，而是要把业务知识系统化。

6. 企业壁垒会回到业务资源层

【支撑判断 6 】 Agent 时代的企业壁垒，不只在模型，而在业务 know-how 、数据结构、 API 能力、权限体系和资源层改造。

模型大家都能用，底层框架也会越来越开放。

真正拉开差距的，可能是这些东西：

•谁更懂业务现场；

•谁的数据更干净；

•谁的 API 更完整；

•谁的权限模型更细；

•谁把复杂流程沉淀成了高质量 skill ；

•谁能把 Agent 接入真实系统，而不只是做演示。

说白了，未来很多公司的 AI 能力，可能不是看它喊了多少口号，而是看它内部系统有没有被整理到 Agent 可以接手。

如果一个公司所有系统都只能靠人点页面，字段含义不清楚，流程靠口口相传，权限要么全开要么全关，那 Agent 再强也很难真正接管工作。

反过来，如果一家公司把数据、 API 、流程、权限、知识库都整理得足够清楚， Agent 的价值就会被放大。

这也是为什么我觉得， Agent 最后会逼着软件公司和业务团队一起改造。

7. 安全会从配角变成主角

【支撑判断 7 】 Agent 一旦能调用工具、读写数据、操作业务系统，权限和安全就会成为 Agent OS 的核心能力。

以前我们说权限，通常是人登录系统：这个账号能看什么，能改什么。

但 Agent 的权限更复杂。

它可能被 prompt injection 诱导；可能调用被污染的 skill ；可能读到不该读的数据；可能在正确工具里执行错误任务；也可能在多个 Agent 通信时把敏感信息带出去。

所以权限不能再只是简单的“允许/拒绝”。

它要细到场景、任务、数据和工具调用：

•这个 Agent 能不能读这类数据；

•能不能写入；

•能不能调用某个 API ；

•能不能无人确认就提交；

•哪些任务必须人工审批；

•失败后能不能自动重试；

•每一步执行日志能不能追溯。

我甚至觉得，一个 Agent OS 成不成熟，很大程度就看它的权限和审计体系。

因为一旦 Agent 进入真实业务，安全不是附加功能，而是地基。

8. 落地不是所有人都去造底层

【支撑判断 8 】团队落地 Agent ，不能只盯个人提效，而要同时做三件事：追踪前沿、改造系统、建设垂直场景。

这段讨论最后落到一个很现实的问题：团队到底该怎么做？

我的理解是，不是所有人都去造 Agent OS 。

更合理的分工是三条线并行。

第一条线：有人持续追踪前沿。

模型、 Agent 框架、 OpenClaw 这类 Agent OS 、工具生态都变化太快了。需要有人每天看、每天更新、快速迁移，保证团队用的是当前最合适的模型和框架。

第二条线：改造内部 SaaS 、 API 和资源层。

不要只让 Agent 模仿人点页面，而是逐步把系统能力变成 Agent 能直接调用的资源。这个动作没那么炫，但它决定了 Agent 能不能稳定落地。

第三条线：做垂直场景。

比如研发、运维、销售、仓储、营销、客服。先从一个岗位、一个流程、一个业务域开始，做出能稳定交付结果的 Agent ，而不是一上来追求万能助手。

这也是我觉得最务实的路线。

个人提效只是第一步，真正的大头在业务团队。那里有大量重复流程，也有大量系统之间的断点。

Agent 如果只让少数技术人员爽一下，价值是有限的。它必须进入业务流程，才会真正改变组织效率。

最后说回结论

这段讨论让我对 AI Agent 的理解变了。

它不是一个单点工具，而是一整套新软件架构。

模型是脑子， Agent OS 是调度系统， API 和数据是身体， skills 是经验和肌肉记忆，权限和审计是安全边界。

所以 AI Agent 下一步最值得看的，不是“它能不能陪你聊天”，也不是“它能不能帮你点按钮”。

真正值得看的，是它能不能把真实工作流重新组织一遍。

如果这个判断成立，那未来几年很多软件都会被重新设计：

不是只给人用，而是同时给人和 Agent 用。

不是只围绕页面，而是围绕任务、数据、权限和可调用能力。

不是只追求一个 AI 助手，而是建设一个能让 Agent 稳定工作的系统。

这就是我听完这段讨论后的核心结论：

AI Agent 的下一步，不是聊天，是重写软件。