一篇讲透:当前 AI Agent 卡点有哪些

先上一张总结图，后面逐条剖析。

一、写在前面

2025 年大家都在说"Agent 元年"，2026 年这一波又改口叫"Agent 工程化年"。但工程化不等于成熟。

我自己用 Agent 这一年多下来，最大的体感是：它真的能干活，但你不能放手不管。让它跑十次相对复杂的工作流，大概有六到七次是顺利的，剩下两三次你会看见它在某个莫名其妙的地方卡住、走偏，或者一脸自信地交付一个错误结果。这种"成功率不够稳"的状态，恰好是 Agent 当前最尴尬的地方——demo 看着很神，跑生产业务就开始掉链子。

为此，这总结了上面这张图：所有让 Agent 真正"能用"的难题，本质上不是模型不够大、不够新，而是模型之外的所有事——它怎么记、怎么想、怎么调工具、怎么和别人配合、怎么被人类信任。换句话说，这不是一个模型问题，是一个系统工程问题。

二、为什么我把它分成三层

8 条难点放在一张图里，乍看是平的。结合跑过几个 Agent 项目以后我发现，它们之间是有清晰的层次的：

底下四条（01–04）是模型自身的能力天花板——靠训练新模型、改架构来推；中间两条（05、06）是长期运行才暴露的系统级特性——靠工程外挂 + 持续对齐来缓解；上面两条（07、08）是多 Agent 时代和规模化落地才会出现的工程问题——靠生态、协议、平台来撑。

不同层有不同的解法，也意味着不同的时间表。混在一起谈，容易得出"Agent 还差得远"或者"Agent 已经无所不能"这种简单结论。但真实情况是——有些层已经接近能用，有些层根本还没起步。

三、能力层：模型自身的硬天花板

最底下、也是最显眼的四条，是 Agent 当前能力的"硬件天花板"。这一层最依赖底模和训练范式的进步，最难"工程外挂"补救。

01 复杂任务的规划与推理。一个真实的 Agent 任务往往是几十步：拆目标、拉数据、调工具、改方案、回头检查、写报告。模型现在做单步推理已经很强，但跨几十步的稳定规划仍然脆弱。它会在中间某一步累积一个小错误，然后整条链一起崩。比如我跑的任务是 80 步，第 47 步它把一个变量名记反了，后面 33 步全废，复盘时看不出错在哪——因为它一路都在自我合理化。开放环境里目标拆解和子任务依赖建模，是这一两年最难啃的方向。

02 工具使用的可靠性。Agent 的本事一半来自工具——API、数据库、搜索、计算器、代码沙箱。但模型对工具的理解仍然不够稳：参数生成会漏字段、调用顺序会错、对返回结果的解读会跑偏。最典型的场景是接一个新接口，泛化能力立刻打折，老接口能稳定跑通的逻辑换成新版本就翻车。所以现在很多团队的做法是：给 Agent 喂"工具说明书"还不够，得喂"工具教程 + 错误样例 + 兜底逻辑"，几乎是在手把手训练它怎么用每一个工具。

03 记忆与上下文管理。这一条我自己最有感触。所有人都在说"AI 像失忆症患者"，可它不是模型不努力——是这件事本身就难。怎么决定哪些信息进短期记忆、哪些沉淀进长期记忆库、哪些到了下次对话该被召回、又该如何让旧记忆不污染新判断，每一步都是工程难题。再叠加一个细节：长对话里上下文窗口虽然到 1M 了，但塞得越满，关键信息丢失的概率反而越高——这叫"中间遗忘/迷失"，英文全名是Lost in the Middle 。现在所有大厂都在做记忆系统，没有一家敢说完全解了。

04 环境感知与理解。Agent 不只是处理文字，它要理解屏幕、视频、声音、传感器读数。多模态融合是这两年的进展焦点，但面对带噪声、模糊、不完整的真实信号——比如一张拍糊的发票、一段方言录音、一个加载到一半的网页——模型仍然很挣扎。Demo 里它能"看懂屏幕"，真把它丢进一个企业内网的复杂界面，准确率立刻掉一大截。环境越乱、信号越脏，Agent 就越像一个"考过试但没干过活"的新人。

四、进化层：长期跑下来才暴露的问题

第 5 和第 6 条，看起来像两个独立的特性，其实是 Agent 长期运行后才暴露的系统级问题。它们的共同点是：短期看不出来，跑久了就要命。

05 自主学习与自我改进。模型一旦训练好就基本"定型"了。一个 Agent 跑了一千次任务、踩过一百次坑，下一次面对相似任务，它不会变得更聪明——除非你重新训练它，或者用很重的工程手段把经验沉淀出来。这是一个根本性的限制。强化学习、反思机制、经验回放这些方向都在做，但效果距离"真正会从经验中学习"还很远。我打个形象的比比喻：现在的 Agent 更像一个永远在第一天上班的实习生，每天热情满满，但昨天的错误第二天还会再犯。这件事不解决，"Agent 越用越聪明"就只是一句口号。

06 可靠性、可控性与安全性。幻觉问题没归零，关键场合仍然会编；越狱、提示注入、误导仍然能绕过对齐机制；对齐和价值观的控制更多还停留在工程外挂层面，比如外面套一层敏感词过滤、套一层意图分类。安全这件事天然不对称——攻击者只要找到一个漏洞，防御者要堵住所有漏洞。Agent 越能干，越需要笼子。但笼子怎么造、造多结实，本身就是一个全新的工程学科。再往后，随着 Agent 接手越来越多不可逆操作（发邮件、转账、改数据库），可靠性这件事会从"质量问题"升级成"事故问题"。

五、系统层：多 Agent 时代的真正挑战

最上面两条，是当 Agent 不再单打独斗时才会浮出水面的问题。

07 多智能体协作。多个 Agent 同时在线，每个有自己的角色和工具，理论上能做的事更多——但现实是：它们的通信协议不统一、意图对齐困难、冲突解决机制粗糙。让 5 个 Agent 合作完成一个项目，比让 1 个 Agent 跑 5 倍长的任务更难。原因很简单：单 Agent 的错误是局部的，多 Agent 的错误会通过通信被放大、被传染。一个 Agent 的小幻觉，到了下游 Agent 那里可能变成大事故。群体智能是个美好的词，工程上还远没成立。

08 工程化与成本。模型推理一次几毛到几块，跑一个完整的 Agent 任务几块到几十块。看起来不贵，乘上规模就是个大数字——某些 to B 客户上线 Agent 第一个月，账单直接超出预期 10 倍是常态。系统集成、调试、监控、运维的复杂度也在指数上涨。更麻烦的是，没人说得清"一个 Agent 跑得好不好"该怎么评估——传统的精度、召回率不适用，新的评估体系还在摸索。最近开始有人讲"Agent Eval"专项，但行业共识远未建立。落地过 Agent 的团队都知道：模型选型只是第一步，真正贵的是后面的工程化。

六、哪些进展快、哪些进展慢

光列难点容易让人沮丧，但其实这 8 条里，前进速度并不平均。这一年我观察下来，大致可以分成三档：

进展最快的是第 02 条（工具使用）和第 04 条（环境感知）。MCP 协议这两年统一了模型调工具的接口，主流模型对工具的稳定性提升肉眼可见；多模态从 2024 年到 2026 年从"看图说话"走到了"操作屏幕"，是质变。这两条已经从"研究问题"变成"工程问题"——意味着只要砸资源就能往前推。

进展中等的是第 01、06、08 条。复杂任务规划靠 Harness Engineering 在工程层面打补丁，可靠性靠对齐技术 + 外挂式安全层在缓慢推进，工程化和成本靠模型蒸馏 + 推理优化在一点点往下压。这三条都是"工程能补一半、模型还得继续努力"的状态——往前走需要双轮驱动。

最难、也最慢的是第 03、05、07 条——记忆、自我改进、多 Agent 协作。这三条的共同特征是：它们不是工程能补的，是模型本身的范式问题。需要新的训练目标、新的架构、甚至新的硬件支持。短期内别指望大跃进，更现实的预期是"每年挪一点点"。

所以这张图我总结完不悲观也不乐观。Agent 不是"已经无所不能"，但也确实不是停滞。它现在的状态像一辆改装得很猛、但底盘还没换的赛车——开起来确实快，但你不能在它过弯的时候松手。

七、写在最后

小结：Agent 真正成熟的标志，不是某个基模发布，而是上面 8 条至少解了 6 条。

这件事不会在一年内完成。但每解一条，都意味着 AI 从"实验室惊喜"往"日常工具"靠近一步。一年前我们对 Agent 的期待是"能不能用"，今年的问题已经变成"在哪些场景下值得用"，明年大概会是"怎么用得更便宜更稳"。问题在变，方向也在变。

所以下次有人跟你说"Agent 已经无所不能"，你可以礼貌地把这张图甩过去——然后告诉他：还差 8 步。但每一步都在走。

看完记得关注我，及时收看更多好文！