
一、写在前面
2025 年大家都在说"Agent 元年",2026 年这一波又改口叫"Agent 工程化年"。但工程化不等于成熟。
我自己用 Agent 这一年多下来,最大的体感是:它真的能干活,但你不能放手不管。让它跑十次相对复杂的工作流,大概有六到七次是顺利的,剩下两三次你会看见它在某个莫名其妙的地方卡住、走偏,或者一脸自信地交付一个错误结果。这种"成功率不够稳"的状态,恰好是 Agent 当前最尴尬的地方——demo 看着很神,跑生产业务就开始掉链子。
为此,这总结了上面这张图:所有让 Agent 真正"能用"的难题,本质上不是模型不够大、不够新,而是模型之外的所有事——它怎么记、怎么想、怎么调工具、怎么和别人配合、怎么被人类信任。换句话说,这不是一个模型问题,是一个系统工程问题。
二、为什么我把它分成三层
8 条难点放在一张图里,乍看是平的。结合跑过几个 Agent 项目以后我发现,它们之间是有清晰的层次的:
底下四条(01–04)是模型自身的能力天花板——靠训练新模型、改架构来推;中间两条(05、06)是长期运行才暴露的系统级特性——靠工程外挂 + 持续对齐来缓解;上面两条(07、08)是多 Agent 时代和规模化落地才会出现的工程问题——靠生态、协议、平台来撑。
不同层有不同的解法,也意味着不同的时间表。混在一起谈,容易得出"Agent 还差得远"或者"Agent 已经无所不能"这种简单结论。但真实情况是——有些层已经接近能用,有些层根本还没起步。

三、能力层:模型自身的硬天花板
最底下、也是最显眼的四条,是 Agent 当前能力的"硬件天花板"。这一层最依赖底模和训练范式的进步,最难"工程外挂"补救。

01 复杂任务的规划与推理。一个真实的 Agent 任务往往是几十步:拆目标、拉数据、调工具、改方案、回头检查、写报告。模型现在做单步推理已经很强,但跨几十步的稳定规划仍然脆弱。它会在中间某一步累积一个小错误,然后整条链一起崩。比如我跑的任务是 80 步,第 47 步它把一个变量名记反了,后面 33 步全废,复盘时看不出错在哪——因为它一路都在自我合理化。开放环境里目标拆解和子任务依赖建模,是这一两年最难啃的方向。
02 工具使用的可靠性。Agent 的本事一半来自工具——API、数据库、搜索、计算器、代码沙箱。但模型对工具的理解仍然不够稳:参数生成会漏字段、调用顺序会错、对返回结果的解读会跑偏。最典型的场景是接一个新接口,泛化能力立刻打折,老接口能稳定跑通的逻辑换成新版本就翻车。所以现在很多团队的做法是:给 Agent 喂"工具说明书"还不够,得喂"工具教程 + 错误样例 + 兜底逻辑",几乎是在手把手训练它怎么用每一个工具。
03 记忆与上下文管理。这一条我自己最有感触。所有人都在说"AI 像失忆症患者",可它不是模型不努力——是这件事本身就难。怎么决定哪些信息进短期记忆、哪些沉淀进长期记忆库、哪些到了下次对话该被召回、又该如何让旧记忆不污染新判断,每一步都是工程难题。再叠加一个细节:长对话里上下文窗口虽然到 1M 了,但塞得越满,关键信息丢失的概率反而越高——这叫"中间遗忘/迷失",英文全名是Lost in the Middle 。现在所有大厂都在做记忆系统,没有一家敢说完全解了。
04 环境感知与理解。Agent 不只是处理文字,它要理解屏幕、视频、声音、传感器读数。多模态融合是这两年的进展焦点,但面对带噪声、模糊、不完整的真实信号——比如一张拍糊的发票、一段方言录音、一个加载到一半的网页——模型仍然很挣扎。Demo 里它能"看懂屏幕",真把它丢进一个企业内网的复杂界面,准确率立刻掉一大截。环境越乱、信号越脏,Agent 就越像一个"考过试但没干过活"的新人。
四、进化层:长期跑下来才暴露的问题
第 5 和第 6 条,看起来像两个独立的特性,其实是 Agent 长期运行后才暴露的系统级问题。它们的共同点是:短期看不出来,跑久了就要命。

05 自主学习与自我改进。模型一旦训练好就基本"定型"了。一个 Agent 跑了一千次任务、踩过一百次坑,下一次面对相似任务,它不会变得更聪明——除非你重新训练它,或者用很重的工程手段把经验沉淀出来。这是一个根本性的限制。强化学习、反思机制、经验回放这些方向都在做,但效果距离"真正会从经验中学习"还很远。我打个形象的比比喻:现在的 Agent 更像一个永远在第一天上班的实习生,每天热情满满,但昨天的错误第二天还会再犯。这件事不解决,"Agent 越用越聪明"就只是一句口号。
06 可靠性、可控性与安全性。幻觉问题没归零,关键场合仍然会编;越狱、提示注入、误导仍然能绕过对齐机制;对齐和价值观的控制更多还停留在工程外挂层面,比如外面套一层敏感词过滤、套一层意图分类。安全这件事天然不对称——攻击者只要找到一个漏洞,防御者要堵住所有漏洞。Agent 越能干,越需要笼子。但笼子怎么造、造多结实,本身就是一个全新的工程学科。再往后,随着 Agent 接手越来越多不可逆操作(发邮件、转账、改数据库),可靠性这件事会从"质量问题"升级成"事故问题"。
五、系统层:多 Agent 时代的真正挑战
最上面两条,是当 Agent 不再单打独斗时才会浮出水面的问题。

07 多智能体协作。多个 Agent 同时在线,每个有自己的角色和工具,理论上能做的事更多——但现实是:它们的通信协议不统一、意图对齐困难、冲突解决机制粗糙。让 5 个 Agent 合作完成一个项目,比让 1 个 Agent 跑 5 倍长的任务更难。原因很简单:单 Agent 的错误是局部的,多 Agent 的错误会通过通信被放大、被传染。一个 Agent 的小幻觉,到了下游 Agent 那里可能变成大事故。群体智能是个美好的词,工程上还远没成立。
08 工程化与成本。模型推理一次几毛到几块,跑一个完整的 Agent 任务几块到几十块。看起来不贵,乘上规模就是个大数字——某些 to B 客户上线 Agent 第一个月,账单直接超出预期 10 倍是常态。系统集成、调试、监控、运维的复杂度也在指数上涨。更麻烦的是,没人说得清"一个 Agent 跑得好不好"该怎么评估——传统的精度、召回率不适用,新的评估体系还在摸索。最近开始有人讲"Agent Eval"专项,但行业共识远未建立。落地过 Agent 的团队都知道:模型选型只是第一步,真正贵的是后面的工程化。
六、哪些进展快、哪些进展慢
光列难点容易让人沮丧,但其实这 8 条里,前进速度并不平均。这一年我观察下来,大致可以分成三档:

进展最快的是第 02 条(工具使用)和第 04 条(环境感知)。MCP 协议这两年统一了模型调工具的接口,主流模型对工具的稳定性提升肉眼可见;多模态从 2024 年到 2026 年从"看图说话"走到了"操作屏幕",是质变。这两条已经从"研究问题"变成"工程问题"——意味着只要砸资源就能往前推。
进展中等的是第 01、06、08 条。复杂任务规划靠 Harness Engineering 在工程层面打补丁,可靠性靠对齐技术 + 外挂式安全层在缓慢推进,工程化和成本靠模型蒸馏 + 推理优化在一点点往下压。这三条都是"工程能补一半、模型还得继续努力"的状态——往前走需要双轮驱动。
最难、也最慢的是第 03、05、07 条——记忆、自我改进、多 Agent 协作。这三条的共同特征是:它们不是工程能补的,是模型本身的范式问题。需要新的训练目标、新的架构、甚至新的硬件支持。短期内别指望大跃进,更现实的预期是"每年挪一点点"。
所以这张图我总结完不悲观也不乐观。Agent 不是"已经无所不能",但也确实不是停滞。它现在的状态像一辆改装得很猛、但底盘还没换的赛车——开起来确实快,但你不能在它过弯的时候松手。
七、写在最后
小结:Agent 真正成熟的标志,不是某个基模发布,而是上面 8 条至少解了 6 条。
这件事不会在一年内完成。但每解一条,都意味着 AI 从"实验室惊喜"往"日常工具"靠近一步。一年前我们对 Agent 的期待是"能不能用",今年的问题已经变成"在哪些场景下值得用",明年大概会是"怎么用得更便宜更稳"。问题在变,方向也在变。
所以下次有人跟你说"Agent 已经无所不能",你可以礼貌地把这张图甩过去——然后告诉他:还差 8 步。但每一步都在走。
夜雨聆风