软件工程正在被 AI Agent 系统性吸收:从驾驭代码到驾驭世界

顶级 AI Agent 团队在把人类最复杂的“工程智慧”献祭给机器,然后让它征服其他领域。
软件工程:权威定义
- IEEE 标准定义:软件工程是将系统化的、严格的、可量化的方法应用于软件的开发、运行和维护,即将工程原理应用于软件。同时也包括对上述方法的研究。
- 更通俗的理解:软件工程 = 工程化思维 + 系统性方法 + 最佳实践 + 管理技术,目的是经济地、高效地、可靠地生产和维护高质量软件。
它借鉴了传统工程(如土木工程、机械工程)的核心理念:用可重复、可度量、可预测的方式解决复杂问题。
驾驭智慧:系统性风险控制
软件工程真正宝贵的地方恰恰是是它背后的系统性驾驭智慧,而不只是某一个、某一类方法论等具体怎么做的框架,它是可以产生、选择和进化各种方法论的“元框架”:
- 如何在不确定性和复杂性中建立秩序
- 如何做权衡(Trade-off)(性能 vs 可维护性、速度 vs 质量)
- 如何长期管理技术债务、规模化协作、持续交付价值
这些跨方法论的底层工程原则,正是顶级 AI Agent 团队正在努力内化的东西。Agent 不是只学会了 Scrum 或 Agile,而是把“在混乱中可靠交付复杂系统”的整套工程思维吃进去了。
ps:我们经常会听到某些人说“傻大黑粗能跑就行”,我的经验是,你一定要警惕,是不是他的能力就只能支撑他所熟悉的业务复杂度的工程?仗再难打一点,他是不是还扛得住?事实证明,往往这类人确实胜任不了。他的思考方式决定了他的成长上限,成长指的不是世俗上的晋升。
AI被低估了:而且是严重低估这个问题要从几个方面来看:1)AI应用虽然现在层出不穷,但是AI的触手还远远没有伸到每个人,尤其是AI产品付费群体,现在还很少,还有巨大的发展空间,后期可能会出现进一步大爆发的机会;2)AI使用率很低,是不是因为他的能力不足?是。但是与很多人观点不一样的是,有些人认为AI能力当下被严重高估、无利可图,我的看法则是提升AI能力恰恰是大家正在努力做的事情,而且我认为是可以有进一步突破的。
我们很可能不是站在一个高估AI能力的面上,而是正站在一个严重低估AI能力的转折点上。很多人会讨论“AI 能写代码了”,甚至还在争论“程序员会不会被逐步取代”。但我认为,真正的影响远比这更深远:软件工程这门人类沉淀下的最复杂、最依赖长期沉淀的“驾驭技能”,正在被 AI Agent 系统性地吸收、内化,并转化为可迁移的通用能力。人类把几十年磨炼出的顶级工程智慧,主动注入给了 Agent,让 Agent 成为新一代的“系统驾驭者”,然后带着这套能力去统治其他所有领域。
能够建立建好这套能力,才是 AI Agent 真正的护城河。
有人会说,杂七杂八的任务跟软件工程有什么关系?看上去没关系,本质上是一个理解任务(理解并挖掘用户需求)可靠交付(分析并确定候选方案并交付验证)并基于用户反馈(验收及价值反馈)不断优化的过程(拥抱变化迭代式严谨)。所以你看,软件工程并不是一套只适用于“软件研发”的智慧,它几乎可以是做任何事的智慧。当然这里并不是说其他领域没有沉淀出自己的智慧,当然有,我在强调数字世界中,软件研发领域的这套智慧在几十年中小大巨大规模任务中经历了充分的检验,而且已经相当的标准化。
AIAgent困境:为什么追赶普及慢
软件工程这些技能,极难通过传统教育快速复制,需要海量真实项目、血泪教训、系统性思考。顶级工程师的“直觉”其实是几十年工程实践的压缩包。而好的 AI Agent 开发团队(Cognition 的 Devin 团队、Princeton 的 SWE-agent 团队、LangGraph/CrewAI 等前沿团队,以及各大公司正在构建的内部 Agent 平台),正在做一件事:把这些人类最顶尖的软件工程技能,系统性地编码进 Agent 的架构、记忆、规划器、工作流和反馈循环里。而且,有意思的是,有些团队不招新人,有沉淀的老人更值钱 :)当然了,有些工程师标榜自己10年经验,实际上也就经历过个位数项目而已,而且项目中还充满了各种 bad practices。如果将AI比作是一面镜子,那它应该能照出很多妖魔鬼怪。
如果AI Agent研发团队自身在“软件工程”领域沉淀不足,那么它们的产品自然也会表现的“很笨”:
– 需求分析:不能正确理解用户想要的东西,用户让干什么就干什么,实际上干完得到的结果也不是用户想要的。所以AI Agent会有与用户的交互、有Plan模式以便与用户对齐;
– 任务编排:用户想要的很大,但是不懂得任务分解、内外部依赖分析、并发及前驱后继依赖处理,导致一个长任务执行耗时过长、上下文爆炸。所以AI Agent会有multitask模式;
– 质量内建:傻大黑粗能跑就行是我听过的最能体现一个工程师沉淀的话术,当然我给的评价是负面,起码你得质量内建的意识吧,在靠人的时候这个问题不大,因为你能制造的代码也就那么点,但是靠AI的时候,它一小时写的代码量顶你几个月的不再话下。如果没有质量内建意识,充满这种论调的团队最后会面临多大风险。所以你看Coding Agent写代码后基本都会自己做验证?单测、接口测试、集成测试、E2E测试,甚至能通过Chrome调试器协议、截屏等操作直接进行类似人类的验收。
– 快速反馈:需求分析、任务分解、质量内建都是快速反馈的手段,但是有一些更有意思的事情值得去思考下。就是有没有进一步做到快速验收、快速反馈、快速增量式迭代。在研发效能领域里,乔梁老师曾经提出过一个价值探索环+验证环,要提效就需要将这个研发流程双螺旋结构中的每个阶段都进行加速,它一定不是一个阶段单一的加速。AI Agent会怎么干?它可能给你多个后选方案,让你选择其中之一,或者直接gitworktree并发交付多个方案。而对于一个可以迭代严谨的feature,它可以先交付最小特性验证,后续再结合任务进度追踪列表继续给按需补齐后续能力。
– 量化指标与质量红线:拿研发领域的CI/CD举个例子。CI/CD是前些年就已经有的理念,时至今日也还有很多团队没有尝试去落地,或者只是只知其形不知其意。阻碍落地的其实是思考问题的方式?很多人会说我担心CI不行、CD不稳,那是因为你没有考虑过如何对代码交付质量、发布质量进行细致全面的量化。你是如何评估代码写的没问题的?你是如何评估你的发布没问题的?这方面有落地经验的,自然会认同我的观点。CI支持代码规范、代码评审、自动化测试、安全扫描,并且设置质量红线门禁对吧,CD支持冒烟、流量调度、灰度验证、快速回滚、滚动发布、服务质量观测,对吧 …… 如果你不能量化它,你就永远不能改进它。如果你不能量化它,你就没有真正掌握它。所以我认为AI Agent也是可以从Coding Agent覆盖到更多其他领域的,比如借助Skills。
我现阶段的一个观点是:
-
如果研发团队不擅长软件工程,很可能开发的AI Agent也是个半吊子;
-
如果团队从来没有可信指标量化产出,那也不能观察并科学地改进它;
说白了,都是人的问题,而不是AI不能覆盖你的领域。
程序员太傻?献祭与新生有些人评价说,软件工程师是最傻的一个群体,它们通过“自由软件运动”、“开放源代码”、AI Agent,这些他们追逐努力的方向,反过来又要摧毁他们自己的金饭碗。
我怎么看待这个事情呢?哈哈,你听过人工智能大佬LeCun怎么评价它毕生的奋斗吗?他说他毕生都在为提升全人类智慧总量而努力。“自由软件运动”“开放源代码”从来不是为了服务于一个特定的个体或者群体,人人为我、我为人人。大家追求的愿景都是更宽广的更美好的世界。
所以现阶段,软件工程师们把自己在最复杂领域积累的顶级智慧,主动献祭给机器。不是因为傻,不是因为他们希望变懒惰,而是因为他们看到了更大的图景——让机器带着这套智慧,去帮助人类解决更广阔的问题。可能是帮助人类解决癌症问题,可能是帮助我们殖民火星,也可能是帮助你实现自己的一个小愿望,写一个自己构思的休闲游戏并分发出去。
结语
最后一点感想吧,AI Agent 不是在取代人类沉淀的软件工程,而是在继承并超越它。软件工程的终极价值,不是代码本身,而是那套在混沌中建立秩序的能力。而现在,这套能力正在被 Agent 带向地球的每一个角落。而这,也只是才刚刚开始。
夜雨聆风