实践论解读:AI 中的追新

深呼吸，然后看完

一、一串词的历史

过去三年，AI 领域流行过一串词。

2023 年，最热的词是 Prompt Engineering。会写提示词的人被称为提示工程师，有人说这是未来十年最重要的职业技能，课程、教程、提示词公式满天飞。

同年 4 月，AutoGPT 爆火。一个开发者把让 GPT-4 自主完成任务的项目传上 GitHub，一周之内星数破万。Agent 这个词从学术圈飞进了每个从业者的嘴里。LangChain 同年从冷门框架变成 LLM 开发的标准配置，融资超两千万美元。

2024 年，风向变了。LangChain 开始挨骂——抽象层太厚，调试困难，团队花在理解框架上的时间快赶上真正开发的时间。Dify、Coze 等更轻量的平台趁势崛起。年底，Anthropic 发布 MCP，解决工具接入碎片化问题，号称 AI 时代的 USB-C 接口。

2025 年，MCP 大规模爆火，OpenAI、Google 相继跟进，国内大厂悉数支持。与此同时，模型本身也在急速变强——很多 2023 年需要复杂 Agent 框架才能完成的任务，一个 Claude 或 GPT 直接处理了。Harness Engineering 的概念随之兴起，核心是给 AI 系统建立约束机制和可观测性，保证生产环境下的可靠运行。

2026 年，MCP 热度趋于平稳走向基础设施化，Hermes 成了新热点。

从 Prompt Engineering 到 Hermes，走完一遍大概三年。每一个词出现的时候，都有一批人涌进去，学，用，然后等下一个词出来，再涌进去。

二、两种人，两种结果

这看起来是正常的学习行为。技术在进步，人跟上节奏，有什么问题？

问题不在于追热点这个行为本身。问题在于追完之后，认识发生了什么。

同样是用了 Prompt Engineering，发现它有局限——两种人的结论截然不同。

第一种人：这个东西过时了，要学新的。

第二种人：提示词的本质是在管理 AI 对任务的理解，它的局限在于无法处理跨步骤的状态——单轮指令无法持续控制复杂流程。这个判断，在后来的 Agent 时代依然成立。

AutoGPT 爆火又沉寂，第一种人的结论是 Agent 这条路行不通。第二种人的结论是：AutoGPT 死掉，不是因为思路错了，而是 2023 年的模型能力和推理成本，还撑不起那个设想。模型够强了，Agent 才真正可行。这个判断，直接解释了为什么 2025 年 Agent 工程化突然成熟——不是概念变了，是模型追上来了。

同样是用了 LangChain，发现它过度封装难以调试——第一种人说，换 Dify。第二种人的结论是：任何试图用固定抽象层管理概率性系统的框架，在复杂度上升时都会崩溃。这不是 LangChain 一家的问题，是这类框架的结构性困境。后来 Harness Engineering 的核心恰恰是：不试图控制 AI 的每一步，而是在系统层建立约束机制和反馈回路。第二种人不需要重新学，他的认识已经指向这里。

两种人用的是同一批工具，经历了同一批失败，得出了完全不同的东西。前者换了一个跟随的对象，后者提炼出了一条可以延续的认识。

三、为什么第一个飞跃没有发生

实践论说，认识有两个飞跃：从实践到认识，再从认识回到实践去验证和发展。

AI 领域多数人卡住的地方，是第一个飞跃没有完成，实践停在了感受层面——好用、不够用、过时了——没有进一步追问：为什么不够用？它的边界从何而来？这个边界在下一个框架里消失了，还是以另一种形式继续存在？

这里有一个结构性的原因，不能只说人不努力。

AI 领域的迭代速度，精确地落在了一个让深入变得不划算的节奏上。LangChain 2023 年是标配，2024 年开始挨骂；MCP 2025 年爆火，2026 年已走向基础设施化。一个框架从爆火到被质疑，往往不超过一年。

于是形成了一种理性的浅尝：快速学会用，发现不够好，等下一个。这在短期内是最优解。

但这个策略有一个延迟出现的代价。三年过去，换过七八个框架，积累的是七八段使用经历，没有一条贯穿下来的认识线。这批人知道每个框架怎么用，但不知道这些框架在解决同一批问题的不同层次。

四、两条线同时在跑

这里有一个容易犯的错误，需要说清楚。

技术演进不是一条单线。这三年里，同时有两条线在跑，而且互相影响。

第一条是工程线：Prompt → Agent → MCP → Harness，是人在解决“怎么组织 AI 能力”的问题。

第二条是模型线：如图所示，是模型本身在变强。

这两条线的交互，才是技术演变的真实原因。AutoGPT 的失败，不是 Agent 思路的失败，是 2023 年的模型能力撑不起那个设想。Prompt Engineering 地位下降，不只是工程范式升级，也是因为模型更聪明了，很多以前需要精心设计提示词才能完成的任务，今天直接丢进去就出来了。

把这两条线分开看，你的判断会更准确：下一个框架出来，你的第一个问题不只是“它解决了什么工程问题”，还应该是“它假设模型具备什么能力，如果模型继续变强，这个框架的价值会放大还是消失”。

MCP 就是一个好例子。如果未来模型足够强，能自己搞清楚如何接入任何工具，MCP 作为标准协议的价值就会改变——不是消失，而是变成基础设施，像 TCP/IP 一样存在但不再是热点。这个判断，不需要等 MCP 真的走到那一步才知道。

五、出路只有一个动作

不是说不追热点。热点要追，新工具要用，这是这个领域的基本要求。

问题是追完之后，有没有做一个动作：把这次使用经历提炼成一个属于自己的判断。

不需要写长文，不需要发表，甚至不需要完整——只需要在用完一个框架之后，逼自己回答三个问题：这个东西解决了什么问题，它在哪里失效，失效的原因是模型能力的局限还是工程设计的局限。

这个区分很重要。如果失效是因为模型不够强，那等模型变强这个问题会自然消解。如果失效是结构性的工程问题，那无论模型多强，这个问题都会以新的形式重新出现。

这个提炼出来的判断是自己的，不会因为框架过时而消失。LangChain 过时了，但“概率性系统不适合固定抽象层管理”这个判断没有过时。AutoGPT 沉寂了，但“Agent 可行性取决于模型能力和推理成本的门槛”这个判断一直在验证。

跟随框架的人，认识跟着框架一起过期。提炼规律的人，框架过时了，认识还在往前走。

城头变幻大王旗，旗还会继续换。每次旗换的时候，你积累下来的是一段使用经历，还是一层真实的认识——这两件事看起来一样，三年之后，结果完全不同。