历史总是押韵的:AI正在用7年,重走软件工程走了70年的路-夜雨聆风

历史总是押韵的:AI正在用7年,重走软件工程走了70年的路

最近比较忙，一周尽量更新一篇。

之前写的一些干货内容我写了本小册子《看图学大模型》，里面包括了大模型的一些基础知识讲解。关注下面公众号，回复“看图学大模型”获取最新版 PDF。

每一次技术革命，都像是在重演同一个剧本。只是这一次，速度快了10倍。

这才没几天，Context Enginnering 已经快过时了，Harness Engineering 正在刷屏。

如果从2022年ChatGPT诞生算起，我们正在经历一场以大语言模型（LLM）为核心的生成式AI应用工程化狂飙。软件工程用了70年走完的路，AI工程化可能只需要7年就能重新走一遍。而且，每一步都惊人地相似。

这篇文章我们回顾一下软件工程(Software Engineering)的历史，并且推测一下 Harness Engineering 的下一步是什么。

第一阶段：Prompt Engineering = 汇编时代

时间回到1950年代。

那时候的程序员，要直接跟机器”说话”——用0和1组成的机器码，或者稍微高级一点的汇编语言。写程序是一门玄学，全靠个人经验和直觉，没有标准，没有复用，换一台机器就得重写。

听起来很熟悉吧？这正是2022-2023年Prompt Engineering（提示词工程）的状态。

“你要在开头加一句’你是一个专业的XXX’……”

“结尾要说’请深呼吸，请一步一步思考’……”

“这个模型要用英文问，那个模型要用中文问……” 更多技巧见：防止模型幻觉的技巧

每个人都在摸索自己的”魔法咒语”，技巧无法标准化，换个模型就得重来。这是AI工程化的石器时代。

第二阶段：Context Engineering = 内存管理与数据库时代

随着软件变得越来越复杂，程序员发现不能把所有数据都塞在CPU的寄存器里。于是，操作系统开始管理虚拟内存，数据库（DBMS）诞生，程序员开始思考如何高效地存取和检索信息。

2024年，AI也发生了类似的转变。

Context Engineering（上下文工程） 解决的正是LLM的”内存问题”。LLM本身是无状态的，它就像一个极其聪明的CPU，但没有硬盘。与其纠结于”怎么问”，不如思考”模型在回答时，脑子里装着什么信息”。

动态注入相关文档（RAG）、管理超长对话历史、向量数据库的兴起……这一切，本质上都是在为无状态的AI构建高效的外部存储和工作记忆。

之前写了一篇 Context Engineering 的文章，感兴趣可以看一看：Context Engineering 是什么

第三阶段：Harness Engineering = 环境与脚手架时代

在软件工程中，为了让代码能够安全、自动化地运行和测试，工程师们发明了沙盒、测试套件（Test Harness）和CI/CD流水线。

现在，AI工程化正在迈入 Harness Engineering 阶段。

很多人误以为这只是”给AI写测试”，但根据OpenAI近期披露的实践，它的内涵要广阔得多。它的核心理念是：人类工程师不再直接写业务代码，而是为AI构建”工作台”（Scaffolding）。

你怎么给Agent提供一个安全的沙盒环境？
你怎么给它配备合适的工具链（Tools）？
当它写错代码时，系统如何自动报错并让它自我修正？

在这个阶段，人类从”写代码的人”，变成了”为AI构建工作环境和安全带的人”。AI在Harness中自主探索、编写、运行和验证，而我们负责掌控边界。

第四阶段及未来：从DevOps到云原生，AI工程化的”大一统”

当AI系统真正走向生产环境，它必然会遇到传统软件经历过的所有阵痛：系统崩溃、接口碎片化、资源浪费。因此，AI工程化正在飞速吸收传统软件后半程的经验，将可靠性工程（SRE）、平台标准化以及云原生思想融为一体：

AI可靠性工程（AI版DevOps/SRE）：代码上线只是开始。为了解决AI的”幻觉”和失控，LLMOps和Agent可观测性（如LangSmith）应运而生，用分布式追踪和错误预算来管理AI的概率性输出。
AI平台与标准化（AI版平台工程）：为了终结工具接口的”战国时代”，以MCP（模型上下文协议）为代表的通用标准正在确立，为Agent开发铺设”黄金路径”。感觉今年以后 MCP 会成为和 http 类似的通用协议。
AI原生基础设施（AI版云原生）：按任务路由模型、Serverless Agent按需唤醒、Multi-Agent微服务化……一切都在向着弹性、自治、按需调用的方向演进。

最后：我们普通人咋办啊

这只是我个人的一些思考，分享给大家。

在当前的阶段，最紧迫的转变是：不要再把自己仅仅定位为一个”写代码的人”，写代码这件事情已经不需要人了。

我最近一直在尝试 Vibe Coding，可以说是远超预期，真的写不过 AI。当AI已经能写出及格甚至优秀的业务代码时，我们的核心价值就不再是亲自敲下每一行代码。未来的开发者，是为AI构建工作环境（Harness）、提供精准上下文（Context）、设定行为边界和评估标准（Eval）的人。

我们需要把AI当成一个聪明但缺乏经验的实习生，我们自己要变成包工头。我们的工作是定义问题、拆解任务、管理复杂性，然后把拆解好的子任务交给AI去实现，最后由来验收和兜底。对于表现好的 AI 就夸上几句，表现不好的 AI 直接开除。

至于更遥远的未来怎么办，目前看的还不提清楚。但是有一点是明确的：纯粹的”中间实现层”（把明确的需求翻译成代码）将被 AI 彻底接管。未来的开发者可能被迫向两个极端转型：

向上走（懂业务与架构）。能需要同时协调十几个不同专业的AI Agent协同工作，这要求具备极强的全局视野和业务洞察力。
向下走（懂底层与基建）。如果有一天 AI 真的把实现层全都接管了，那保证 AI 能又快又稳的运行变得越来越重要。所以底层架构的加速、安全、高可用等为 AI 兜底的工程能力，也许是未来工程师的一种形态。

— END —

最近更新了很多面试的题目解析，有朋友私信我感觉很有帮助，问是否有面试的合集？于是我最近整理了一下，弄了个付费项目：《大模型面试指南》。定价一个题目一块钱，边更新边涨价，目前也就是一顿饭钱，早买早享受。

目前两种购买方式，一种是知乎专栏，一种是微信小程序。

第一种适合喜欢在电脑上看的同学，长按下面二维码访问知乎专栏：

第二种是在微信的生态里，可以扫描下面二维码购买。

公众号依然会持续更新，这个指南与公众号不一样的地方有：

1. 会修正公众号的错误，并且对一些答案进行补充。比如上周发的output token为什么更贵，其实还有缓存和采样的影响，但是公众号一旦发出去了没办法修改，好的答案还是需要有一些修改和沉淀。

2. 新增了：题目的考察点、基于当前问题的追问、进一步学习资料三个模块，方便构建知识体系。

3. 核心且难以理解的地方，会附上完整可运行的代码，有代码理解起来更容易。

4. 里面内容会包含面试时的一些注意事项，我自己工作了十多年，估计面试了几百人了吧，也有一些感悟。

点击下面小程序可以预览内容