乐于分享
好东西不私藏

我听完这场 Agent 讨论,觉得软件要重写了

我听完这场 Agent 讨论,觉得软件要重写了

最近听了一段关于 AI Agents 发展的讨论,信息量很大。

但我不想把它写成一篇“观点汇总”。

因为这段讨论真正有价值的地方,不是每个人分别说了什么,而是它最后指向了一个更大的判断:

【核心结论】 AI Agent 的下一阶段,不是做出更多会聊天、会点鼠标的助手,而是倒逼软件系统本身被重写一遍。

换句话说, Agent 不是给旧软件贴一层 AI 皮,而是会让 SaaS 、 API 、数据、权限、工作流、组织协作都重新长一遍。

我一开始也容易把 Agent 理解成“更聪明的自动化工具”。但听到后面,我觉得这个理解太窄了。真正的问题不是“Agent 会不会替我点按钮”,而是:如果软件未来不仅给人用,也要给 Agent 用,那软件应该怎么设计?

这篇文章就围绕这个结论展开。

1. Agent 现在卡住的,不是一个 prompt 问题

【支撑判断 1 】今天 Agent 最大的瓶颈,不只是模型不够聪明,而是执行失败率、黑盒过程、速度、成本、兼容性和安全问题。

这点特别现实。

我们现在看一个 Agent ,常常先问:“它背后用的是哪个模型? Claude 还是别的?推理能力强不强?”

但真正放到工作里,问题马上变成另一套:

它能不能稳定跑完任务?失败了能不能知道失败在哪里?中间过程是不是可观察?速度够不够快?一次任务成本多少?在 Windows 、本地软件、复杂 SaaS 里能不能装、能不能跑?权限怎么控制?如果它改错代码、写错数据、触发线上事故,谁来负责?

这些问题听起来没有“模型能力”那么性感,但它们才决定 Agent 能不能进真实业务。

个人玩一玩,失败了可以重试。企业里用,失败就是成本,误操作就是风险,黑盒就是没人敢托付。

所以这段讨论让我更确定一件事: Agent 的竞争不会只停留在模型层。模型当然重要,但从 Demo 走向业务,关键是执行系统。

2. 真正关键的是 Agent OS

【支撑判断 2 】模型像大脑, Agent OS 像操作系统。模型理解意图, Agent OS 负责拆任务、调度资源、管理权限、记录过程和协调多个 Agent 。

讨论里反复出现一个词: Agent OS 。

我自己的理解是,它不是传统意义上的 Windows 、 macOS ,也不是一个普通 App 。它更像 AI 工作流上方长出来的一层“任务操作系统”。

比如我说:“帮我整理这周销售数据,找出异常,并写一份汇报。”

模型能理解我要什么。但如果让模型自己一路硬干到底,它就会遇到很多问题:去哪查数据?用哪个接口?有没有权限?异常怎么定义?要不要让另一个 Agent 生成图表?最后能不能自动提交?失败了怎么重试?

这些都不是一句 prompt 能解决的。

Agent OS 要做的,就是把“聪明的大脑”变成“能稳定干活的系统”:

把目标拆成任务;
选择合适工具和数据;
调度不同子 Agent ;
管理权限和执行边界;
记录过程,方便复盘;
失败后重试、降级或交给人;
让多个 Agent 之间可以通信。

所以我现在更愿意把 Agent 看成一个系统,而不是一个聊天窗口。

没有 Agent OS , Agent 容易停留在 Demo ;有了 Agent OS ,它才可能进入公司流程。

3. SaaS 会被重新设计

【支撑判断 3 】未来 SaaS 不能只面向人类 UI ,还要面向 Agent 暴露 API 、结构化数据、业务规则和权限能力。

这是我听完后最强烈的感受。

今天的 SaaS ,本质上是围绕人设计的。人打开页面,人看表格,人点按钮,人填表单,人确认提交。

但 Agent 不是人。

让 Agent 看屏幕、点按钮、学录屏,当然能解决一部分问题。但这更像过渡方案。

它解决的是“眼前能不能跑”。真正长期要解决的是“能不能稳定、低成本、可控地跑”。

这就要求 SaaS 自己发生变化。

未来一个适合 Agent 的 SaaS ,可能要同时具备几层:

UI 层:继续给人使用;
API 层:给 Agent 直接调用;
数据层:用结构化方式表达业务对象;
知识层:让 Agent 理解业务规则、流程约束和异常处理;
权限层:控制 Agent 在什么场景下能做什么;
日志层:记录 Agent 做过什么,方便审计和回滚。

以前产品经理可能主要关心“这个页面好不好用”。以后还要多问一句:“这个系统, Agent 好不好用?”

这不是在页面上加一个 AI 按钮。

这是软件底层要重新整理。

4. Skill 的价值,是把经验变成可复用能力

【支撑判断 4 】 Tool 更像机器可调用的插件/API , Skill 更像人类可读的经验包、流程脚本和知识说明书。

这段讨论里还有一个很重要的区分: Skills 和 Tools 不是一回事。

Tool 更像机器接口。比如搜索、查数据库、调用图片生成、发送公众号草稿、执行脚本。这类东西标准、明确、适合程序调用。

Skill 更像“怎么把这件事做好”的说明书。它可以包含流程、经验、示例、脚本、注意事项、风格要求,甚至是一个人多年工作方法的压缩包。

比如一个写公众号的 skill ,不应该只是“调用微信 API”。它还应该知道怎么选题、怎么开头、怎么组织观点、怎么配图、怎么写摘要、怎么避免 AI 味太重。

这也是我最近越来越有感触的地方。

Skill 最有意思的地方不是“自动”,而是“沉淀”。团队里真正值钱的经验,很多时候藏在老手的判断、顺序、取舍和检查清单里。 Skill 如果能把这些东西沉淀下来,它就不是一个提示词,而是一套可复用的工作方法。

所以, Agent 时代的能力建设,不只是多接几个工具,还要把人的经验写成 Agent 能理解、能执行、能复用的 skill 。

5. 真 Agent 不是旧工作流套一层 LLM

【支撑判断 5 】真正的 Agent ,不应该只是把人工 workflow 包一层 LLM ,而是让模型理解业务目标,再由 Agent OS 编排执行。

过去很多“智能体”,其实更像旧工作流升级版。

人先写好流程:第一步查数据,第二步填表,第三步生成报告,第四步发消息。 LLM 只是负责其中某一段理解或生成。

这当然有价值,但它不是 Agent 的最终形态。

旧工作流是:人把流程写死,机器照做。

新 Agent 应该是:人给目标和边界,模型理解业务意图, Agent OS 组织执行。

这里要注意,我不是说业务规则不重要。

恰恰相反,业务规则会变得更重要。模型不会凭空知道一家公司的数据口径、审批规则、岗位职责和异常流程。企业必须把这些知识、数据、权限边界整理出来,放进 Agent 能调用的资源层。

所以 Agent 的落地,不是“买个模型就行”,而是要把业务知识系统化。

6. 企业壁垒会回到业务资源层

【支撑判断 6 】 Agent 时代的企业壁垒,不只在模型,而在业务 know-how 、数据结构、 API 能力、权限体系和资源层改造。

模型大家都能用,底层框架也会越来越开放。

真正拉开差距的,可能是这些东西:

谁更懂业务现场;
谁的数据更干净;
谁的 API 更完整;
谁的权限模型更细;
谁把复杂流程沉淀成了高质量 skill ;
谁能把 Agent 接入真实系统,而不只是做演示。

说白了,未来很多公司的 AI 能力,可能不是看它喊了多少口号,而是看它内部系统有没有被整理到 Agent 可以接手。

如果一个公司所有系统都只能靠人点页面,字段含义不清楚,流程靠口口相传,权限要么全开要么全关,那 Agent 再强也很难真正接管工作。

反过来,如果一家公司把数据、 API 、流程、权限、知识库都整理得足够清楚, Agent 的价值就会被放大。

这也是为什么我觉得, Agent 最后会逼着软件公司和业务团队一起改造。

7. 安全会从配角变成主角

【支撑判断 7 】 Agent 一旦能调用工具、读写数据、操作业务系统,权限和安全就会成为 Agent OS 的核心能力。

以前我们说权限,通常是人登录系统:这个账号能看什么,能改什么。

但 Agent 的权限更复杂。

它可能被 prompt injection 诱导;可能调用被污染的 skill ;可能读到不该读的数据;可能在正确工具里执行错误任务;也可能在多个 Agent 通信时把敏感信息带出去。

所以权限不能再只是简单的“允许/拒绝”。

它要细到场景、任务、数据和工具调用:

这个 Agent 能不能读这类数据;
能不能写入;
能不能调用某个 API ;
能不能无人确认就提交;
哪些任务必须人工审批;
失败后能不能自动重试;
每一步执行日志能不能追溯。

我甚至觉得,一个 Agent OS 成不成熟,很大程度就看它的权限和审计体系。

因为一旦 Agent 进入真实业务,安全不是附加功能,而是地基。

8. 落地不是所有人都去造底层

【支撑判断 8 】团队落地 Agent ,不能只盯个人提效,而要同时做三件事:追踪前沿、改造系统、建设垂直场景。

这段讨论最后落到一个很现实的问题:团队到底该怎么做?

我的理解是,不是所有人都去造 Agent OS 。

更合理的分工是三条线并行。

第一条线:有人持续追踪前沿。

模型、 Agent 框架、 OpenClaw 这类 Agent OS 、工具生态都变化太快了。需要有人每天看、每天更新、快速迁移,保证团队用的是当前最合适的模型和框架。

第二条线:改造内部 SaaS 、 API 和资源层。

不要只让 Agent 模仿人点页面,而是逐步把系统能力变成 Agent 能直接调用的资源。这个动作没那么炫,但它决定了 Agent 能不能稳定落地。

第三条线:做垂直场景。

比如研发、运维、销售、仓储、营销、客服。先从一个岗位、一个流程、一个业务域开始,做出能稳定交付结果的 Agent ,而不是一上来追求万能助手。

这也是我觉得最务实的路线。

个人提效只是第一步,真正的大头在业务团队。那里有大量重复流程,也有大量系统之间的断点。

Agent 如果只让少数技术人员爽一下,价值是有限的。它必须进入业务流程,才会真正改变组织效率。

最后说回结论

这段讨论让我对 AI Agent 的理解变了。

它不是一个单点工具,而是一整套新软件架构。

模型是脑子, Agent OS 是调度系统, API 和数据是身体, skills 是经验和肌肉记忆,权限和审计是安全边界。

所以 AI Agent 下一步最值得看的,不是“它能不能陪你聊天”,也不是“它能不能帮你点按钮”。

真正值得看的,是它能不能把真实工作流重新组织一遍。

如果这个判断成立,那未来几年很多软件都会被重新设计:

不是只给人用,而是同时给人和 Agent 用。

不是只围绕页面,而是围绕任务、数据、权限和可调用能力。

不是只追求一个 AI 助手,而是建设一个能让 Agent 稳定工作的系统。

这就是我听完这段讨论后的核心结论:

AI Agent 的下一步,不是聊天,是重写软件。