深呼吸,然后看完
一、一串词的历史
过去三年,AI 领域流行过一串词。
2023 年,最热的词是 Prompt Engineering。会写提示词的人被称为提示工程师,有人说这是未来十年最重要的职业技能,课程、教程、提示词公式满天飞。
同年 4 月,AutoGPT 爆火。一个开发者把让 GPT-4 自主完成任务的项目传上 GitHub,一周之内星数破万。Agent 这个词从学术圈飞进了每个从业者的嘴里。LangChain 同年从冷门框架变成 LLM 开发的标准配置,融资超两千万美元。
2024 年,风向变了。LangChain 开始挨骂——抽象层太厚,调试困难,团队花在理解框架上的时间快赶上真正开发的时间。Dify、Coze 等更轻量的平台趁势崛起。年底,Anthropic 发布 MCP,解决工具接入碎片化问题,号称 AI 时代的 USB-C 接口。
2025 年,MCP 大规模爆火,OpenAI、Google 相继跟进,国内大厂悉数支持。与此同时,模型本身也在急速变强——很多 2023 年需要复杂 Agent 框架才能完成的任务,一个 Claude 或 GPT 直接处理了。Harness Engineering 的概念随之兴起,核心是给 AI 系统建立约束机制和可观测性,保证生产环境下的可靠运行。
2026 年,MCP 热度趋于平稳走向基础设施化,Hermes 成了新热点。
从 Prompt Engineering 到 Hermes,走完一遍大概三年。每一个词出现的时候,都有一批人涌进去,学,用,然后等下一个词出来,再涌进去。
二、两种人,两种结果
这看起来是正常的学习行为。技术在进步,人跟上节奏,有什么问题?
问题不在于追热点这个行为本身。问题在于追完之后,认识发生了什么。
同样是用了 Prompt Engineering,发现它有局限——两种人的结论截然不同。
第一种人:这个东西过时了,要学新的。
第二种人:提示词的本质是在管理 AI 对任务的理解,它的局限在于无法处理跨步骤的状态——单轮指令无法持续控制复杂流程。这个判断,在后来的 Agent 时代依然成立。
AutoGPT 爆火又沉寂,第一种人的结论是 Agent 这条路行不通。第二种人的结论是:AutoGPT 死掉,不是因为思路错了,而是 2023 年的模型能力和推理成本,还撑不起那个设想。模型够强了,Agent 才真正可行。这个判断,直接解释了为什么 2025 年 Agent 工程化突然成熟——不是概念变了,是模型追上来了。
同样是用了 LangChain,发现它过度封装难以调试——第一种人说,换 Dify。第二种人的结论是:任何试图用固定抽象层管理概率性系统的框架,在复杂度上升时都会崩溃。这不是 LangChain 一家的问题,是这类框架的结构性困境。后来 Harness Engineering 的核心恰恰是:不试图控制 AI 的每一步,而是在系统层建立约束机制和反馈回路。第二种人不需要重新学,他的认识已经指向这里。
两种人用的是同一批工具,经历了同一批失败,得出了完全不同的东西。前者换了一个跟随的对象,后者提炼出了一条可以延续的认识。
三、为什么第一个飞跃没有发生
实践论说,认识有两个飞跃:从实践到认识,再从认识回到实践去验证和发展。
AI 领域多数人卡住的地方,是第一个飞跃没有完成,实践停在了感受层面——好用、不够用、过时了——没有进一步追问:为什么不够用?它的边界从何而来?这个边界在下一个框架里消失了,还是以另一种形式继续存在?
这里有一个结构性的原因,不能只说人不努力。
AI 领域的迭代速度,精确地落在了一个让深入变得不划算的节奏上。LangChain 2023 年是标配,2024 年开始挨骂;MCP 2025 年爆火,2026 年已走向基础设施化。一个框架从爆火到被质疑,往往不超过一年。
于是形成了一种理性的浅尝:快速学会用,发现不够好,等下一个。这在短期内是最优解。
但这个策略有一个延迟出现的代价。三年过去,换过七八个框架,积累的是七八段使用经历,没有一条贯穿下来的认识线。这批人知道每个框架怎么用,但不知道这些框架在解决同一批问题的不同层次。
四、两条线同时在跑
这里有一个容易犯的错误,需要说清楚。
技术演进不是一条单线。这三年里,同时有两条线在跑,而且互相影响。
第一条是工程线:Prompt → Agent → MCP → Harness,是人在解决“怎么组织 AI 能力”的问题。
第二条是模型线:如图所示,是模型本身在变强。

这两条线的交互,才是技术演变的真实原因。AutoGPT 的失败,不是 Agent 思路的失败,是 2023 年的模型能力撑不起那个设想。Prompt Engineering 地位下降,不只是工程范式升级,也是因为模型更聪明了,很多以前需要精心设计提示词才能完成的任务,今天直接丢进去就出来了。
把这两条线分开看,你的判断会更准确:下一个框架出来,你的第一个问题不只是“它解决了什么工程问题”,还应该是“它假设模型具备什么能力,如果模型继续变强,这个框架的价值会放大还是消失”。
MCP 就是一个好例子。如果未来模型足够强,能自己搞清楚如何接入任何工具,MCP 作为标准协议的价值就会改变——不是消失,而是变成基础设施,像 TCP/IP 一样存在但不再是热点。这个判断,不需要等 MCP 真的走到那一步才知道。
五、出路只有一个动作
不是说不追热点。热点要追,新工具要用,这是这个领域的基本要求。
问题是追完之后,有没有做一个动作:把这次使用经历提炼成一个属于自己的判断。
不需要写长文,不需要发表,甚至不需要完整——只需要在用完一个框架之后,逼自己回答三个问题:这个东西解决了什么问题,它在哪里失效,失效的原因是模型能力的局限还是工程设计的局限。
这个区分很重要。如果失效是因为模型不够强,那等模型变强这个问题会自然消解。如果失效是结构性的工程问题,那无论模型多强,这个问题都会以新的形式重新出现。
这个提炼出来的判断是自己的,不会因为框架过时而消失。LangChain 过时了,但“概率性系统不适合固定抽象层管理”这个判断没有过时。AutoGPT 沉寂了,但“Agent 可行性取决于模型能力和推理成本的门槛”这个判断一直在验证。
跟随框架的人,认识跟着框架一起过期。提炼规律的人,框架过时了,认识还在往前走。
城头变幻大王旗,旗还会继续换。每次旗换的时候,你积累下来的是一段使用经历,还是一层真实的认识——这两件事看起来一样,三年之后,结果完全不同。
夜雨聆风