历史总是押韵的:AI正在用7年,重走软件工程走了70年的路
最近比较忙,一周尽量更新一篇。
之前写的一些干货内容我写了本小册子《看图学大模型》,里面包括了大模型的一些基础知识讲解。关注下面公众号,回复“看图学大模型”获取最新版 PDF。

每一次技术革命,都像是在重演同一个剧本。只是这一次,速度快了10倍。
这才没几天,Context Enginnering 已经快过时了,Harness Engineering 正在刷屏。
如果从2022年ChatGPT诞生算起,我们正在经历一场以大语言模型(LLM)为核心的生成式AI应用工程化狂飙。软件工程用了70年走完的路,AI工程化可能只需要7年就能重新走一遍。而且,每一步都惊人地相似。
这篇文章我们回顾一下软件工程(Software Engineering)的历史,并且推测一下 Harness Engineering 的下一步是什么。
第一阶段:Prompt Engineering = 汇编时代
时间回到1950年代。
那时候的程序员,要直接跟机器”说话”——用0和1组成的机器码,或者稍微高级一点的汇编语言。写程序是一门玄学,全靠个人经验和直觉,没有标准,没有复用,换一台机器就得重写。
听起来很熟悉吧?这正是2022-2023年Prompt Engineering(提示词工程)的状态。
“你要在开头加一句’你是一个专业的XXX’……”
“结尾要说’请深呼吸,请一步一步思考’……”
“这个模型要用英文问,那个模型要用中文问……” 更多技巧见:防止模型幻觉的技巧
每个人都在摸索自己的”魔法咒语”,技巧无法标准化,换个模型就得重来。这是AI工程化的石器时代。
第二阶段:Context Engineering = 内存管理与数据库时代
随着软件变得越来越复杂,程序员发现不能把所有数据都塞在CPU的寄存器里。于是,操作系统开始管理虚拟内存,数据库(DBMS)诞生,程序员开始思考如何高效地存取和检索信息。
2024年,AI也发生了类似的转变。
Context Engineering(上下文工程) 解决的正是LLM的”内存问题”。LLM本身是无状态的,它就像一个极其聪明的CPU,但没有硬盘。与其纠结于”怎么问”,不如思考”模型在回答时,脑子里装着什么信息”。
动态注入相关文档(RAG)、管理超长对话历史、向量数据库的兴起……这一切,本质上都是在为无状态的AI构建高效的外部存储和工作记忆。
之前写了一篇 Context Engineering 的文章,感兴趣可以看一看:Context Engineering 是什么
第三阶段:Harness Engineering = 环境与脚手架时代
在软件工程中,为了让代码能够安全、自动化地运行和测试,工程师们发明了沙盒、测试套件(Test Harness)和CI/CD流水线。
现在,AI工程化正在迈入 Harness Engineering 阶段。
很多人误以为这只是”给AI写测试”,但根据OpenAI近期披露的实践,它的内涵要广阔得多。它的核心理念是:人类工程师不再直接写业务代码,而是为AI构建”工作台”(Scaffolding)。
-
你怎么给Agent提供一个安全的沙盒环境? -
你怎么给它配备合适的工具链(Tools)? -
当它写错代码时,系统如何自动报错并让它自我修正?
在这个阶段,人类从”写代码的人”,变成了”为AI构建工作环境和安全带的人”。AI在Harness中自主探索、编写、运行和验证,而我们负责掌控边界。
第四阶段及未来:从DevOps到云原生,AI工程化的”大一统”
当AI系统真正走向生产环境,它必然会遇到传统软件经历过的所有阵痛:系统崩溃、接口碎片化、资源浪费。因此,AI工程化正在飞速吸收传统软件后半程的经验,将可靠性工程(SRE)、平台标准化以及云原生思想融为一体:
-
AI可靠性工程(AI版DevOps/SRE):代码上线只是开始。为了解决AI的”幻觉”和失控,LLMOps和Agent可观测性(如LangSmith)应运而生,用分布式追踪和错误预算来管理AI的概率性输出。 -
AI平台与标准化(AI版平台工程):为了终结工具接口的”战国时代”,以MCP(模型上下文协议)为代表的通用标准正在确立,为Agent开发铺设”黄金路径”。感觉今年以后 MCP 会成为和 http 类似的通用协议。 -
AI原生基础设施(AI版云原生):按任务路由模型、Serverless Agent按需唤醒、Multi-Agent微服务化……一切都在向着弹性、自治、按需调用的方向演进。
最后:我们普通人咋办啊
这只是我个人的一些思考,分享给大家。
在当前的阶段,最紧迫的转变是:不要再把自己仅仅定位为一个”写代码的人”,写代码这件事情已经不需要人了。
我最近一直在尝试 Vibe Coding,可以说是远超预期,真的写不过 AI。当AI已经能写出及格甚至优秀的业务代码时,我们的核心价值就不再是亲自敲下每一行代码。未来的开发者,是为AI构建工作环境(Harness)、提供精准上下文(Context)、设定行为边界和评估标准(Eval)的人。
我们需要把AI当成一个聪明但缺乏经验的实习生,我们自己要变成包工头。我们的工作是定义问题、拆解任务、管理复杂性,然后把拆解好的子任务交给AI去实现,最后由来验收和兜底。对于表现好的 AI 就夸上几句,表现不好的 AI 直接开除。
至于更遥远的未来怎么办,目前看的还不提清楚。但是有一点是明确的:纯粹的”中间实现层”(把明确的需求翻译成代码)将被 AI 彻底接管。未来的开发者可能被迫向两个极端转型:
-
向上走(懂业务与架构)。能需要同时协调十几个不同专业的AI Agent协同工作,这要求具备极强的全局视野和业务洞察力。 -
向下走(懂底层与基建)。如果有一天 AI 真的把实现层全都接管了,那保证 AI 能又快又稳的运行变得越来越重要。所以底层架构的加速、安全、高可用等为 AI 兜底的工程能力,也许是未来工程师的一种形态。
— END —
最近更新了很多面试的题目解析,有朋友私信我感觉很有帮助,问是否有面试的合集?于是我最近整理了一下,弄了个付费项目:《大模型面试指南》。定价一个题目一块钱,边更新边涨价,目前也就是一顿饭钱,早买早享受。
目前两种购买方式,一种是知乎专栏,一种是微信小程序。
第一种适合喜欢在电脑上看的同学,长按下面二维码访问知乎专栏:

第二种是在微信的生态里,可以扫描下面二维码购买。

公众号依然会持续更新,这个指南与公众号不一样的地方有:
1. 会修正公众号的错误,并且对一些答案进行补充。比如上周发的output token为什么更贵,其实还有缓存和采样的影响,但是公众号一旦发出去了没办法修改,好的答案还是需要有一些修改和沉淀。
2. 新增了:题目的考察点、基于当前问题的追问、进一步学习资料三个模块,方便构建知识体系。
3. 核心且难以理解的地方,会附上完整可运行的代码,有代码理解起来更容易。
4. 里面内容会包含面试时的一些注意事项,我自己工作了十多年,估计面试了几百人了吧,也有一些感悟。
点击下面小程序可以预览内容
推荐阅读:
“交叉熵 (cross entropy) ,KL 散度的值,到底有什么含义?”
学妹:“基于 Llama 的模型都有哪些?有什么细微的差异?”
字节大模型一面:“Beam Search 最坏时间复杂度是多少?”

点击关注,每周一周三更新干货,周五闲聊+AI论文工具推荐
万水千山总是情,点个【在看】,行不行?
夜雨聆风