AI Coding 的下一阶段:不是更强模型,而是 AI 软件工程操作系统

过去一年，AI Coding 圈最大的错觉之一，是大家以为：

«“只要模型越来越强，软件开发就会被彻底自动化。”»

但最近看完 flow-kit 和《十年老技术开发的 AI Agent 探索之路》之后，我越来越确信：

真正决定 AI 开发上限的，

已经不再是模型能力本身。

而是：

AI 软件工程系统能力。

这意味着，行业正在从：

Prompt Engineering

进入：

AI Software Engineering

甚至：

AI Operating System

时代。

---

一、AI Coding 正在从“聊天”进化成“系统”

过去的 AI Coding 模式，本质上是：

人

↔

AI 对话

↔

代码

核心依赖：

- Prompt 技巧

- 上下文长度

- 模型能力

- Agent 工作流

这种模式前期非常爽。

一句话生成页面。

几分钟搭完 Demo。

一个晚上写出 MVP。

但问题也很快暴露：

- AI 开始失忆

- 架构开始漂移

- 上下文越来越脏

- 重复踩坑

- 修改互相污染

- 长周期维护失控

很多人以为这是“模型不够强”。

但实际上：

这是软件工程问题。

不是模型问题。

---

二、真正的瓶颈，其实是“人”

《十年老技术开发的 AI Agent 探索之路》里有一个特别真实的场景：

作者同时开着：

- Claude

- Codex

- Gemini

- Cursor

多个终端并发开发。

看起来很先进。

但真实情况是：

- 忘了哪个 Agent 改了哪个分支

- 一个终端卡住十分钟没发现

- 文档和代码状态不同步

- AI 之间无法共享上下文

最终发现：

人脑的并发极限，大概就是 4-6 个 Agent。

再多就会开始崩溃。

于是作者得出了一个非常重要的结论：

«AI 的价值不是替代人，

而是让系统不再依赖人的实时在场。»

这句话非常关键。

因为它意味着：

AI 开发真正的问题，

已经不是“怎么生成代码”。

而是：

“怎么让 AI 长期稳定工作。”

---

三、80% 的 AI 需求，其实根本不需要 AI

这是文章里我最认同的一部分。

作者发现：

大量所谓“AI 需求”，本质上只是自动化需求。

比如：

- 定时任务

- 健康检查

- 日志分析

- 文件监听

- 数据同步

这些：

cron + curl + jq + shell

就能解决。

于是作者提出了一个非常经典的决策链：

目标

↓

代码

↓

CLI

↓

Prompt

↓

Agent

能在低层解决的问题，

绝不上推。

这是一个极其重要的工程认知。

因为现在 AI 圈有个很严重的问题：

“过度 Agent 化”。

很多东西：

10 行 Bash 就能解决。

结果硬套：

- LangChain

- Workflow

- Tool Calling

- Multi-Agent

最后：

复杂度暴涨，

稳定性下降，

成本翻倍。

本质上：

AI 不应该成为默认答案。

---

四、Vibe Coding 最大的问题：先易后难

这部分非常真实。

很多人第一次用 AI Coding 都会经历：

Day 1：

AI 太强了！

Day 7：

代码越来越乱。

Day 14：

开始怀疑人生。

Day 15：

被迫重构整个项目。

为什么？

因为 Vibe Coding 本质是：

“用未来的技术债，换今天的爽感。”

前期：

- 不写 spec

- 不做设计

- 不做约束

AI 看起来效率极高。

但后期：

- 架构漂移

- 抽象失控

- 重复逻辑

- 修改互相污染

于是作者最终回到了：

SDD（Spec-Driven Development）

即：

spec

→

plan

→

tasks

很多人误以为：

SDD 是“写文档”。

其实不是。

SDD 真正的价值是：

“把模糊目标逐步压缩成可执行状态。”

它让 AI：

- 可追踪

- 可恢复

- 可复盘

- 可治理

---

五、flow-kit 本质上在解决什么？

看完之后，我突然意识到：

flow-kit 真正厉害的地方，

不是“Prompt 模板”。

而是：

它在补 AI Coding 最大的缺口：

- 长期记忆

- 工程治理

- 状态管理

- 架构演化

- 失败恢复

比如：

PROGRESS.md

解决：

AI 失忆

---

LESSONS.md

解决：

重复踩坑

---

CONTEXT / ARCHITECTURE

解决：

架构漂移

---

RULES / Approval

解决：

AI 乱改

---

A-evolve

解决：

长期演化

所以 flow-kit 本质上已经不是：

AI Coding Tool

而是：

“轻量版 AI 软件工程操作系统”。

---

六、真正重要的，不再是模型，而是治理

文章里有一句话我印象特别深：

«“垃圾的思考 × 强大的模型 = 精美的垃圾。”»

这是现在 AI Coding 最大的问题。

很多人疯狂追：

- 最新模型

- 最大上下文

- 最强推理

但忽略了：

- observability

- eval

- runtime

- control plane

- 状态管理

- 权限治理

结果：

模型越强，

系统越不可控。

于是作者提出一个非常反直觉的观点：

“脚手架 > 模型。”

因为：

一个拥有：

- 规范

- 留痕

- 调度

- 状态

- 评估

- 治理

的系统。

即使用中等模型：

也可能远强于：

顶级模型 + 混乱工作流

---

七、行业真正的变化：从 Prompt 时代进入 Runtime 时代

现在行业已经开始出现明显趋势：

- MCP

- A2A

- Responses API

- Agent Runtime

- Multi-Agent Coordination

这些东西意味着：

行业重点正在从：

Prompt Engineering

转向：

“AI Runtime + Protocol + Control Plane”。

未来真正值钱的：

不一定是：

谁更会写 Prompt

而是：

谁更懂：

- Runtime

- 协议

- 状态

- 调度

- 评估

- 多 Agent 协作

- 工程治理

因为：

AI 正在从工具，进化成系统。

---

八、最终形态：Goal-Driven AI Software Engineering

文章最后一个非常重要的认知跃迁：

从：

Task-Driven

进入：

Goal-Driven

区别是：

以前：

人派任务

AI执行

未来：

人定义目标

系统自主推进

这已经不是：

“AI 帮你写代码”。

而是：

“AI 团队”。

未来可能会出现：

- Architect Agent

- Backend Agent

- Frontend Agent

- QA Agent

- Security Agent

- DevOps Agent

- Review Agent

而：

- flow-kit 负责规范

- Runtime 负责调度

- MCP/A2A 负责通信

- Goal-Driven 负责推进

- Human 负责目标与边界

这其实已经越来越像：

AI 软件工程操作系统。

---

九、最后一句话

过去：

AI 是工具。

现在：

AI 是协作者。

未来：

AI 会成为长期运行的软件工程系统。

而真正决定未来上限的，

不再是模型参数。

而是：

- 规范

- Runtime

- 状态

- 治理

- 协议

- Eval

- Observability

- Goal-Driven

这可能才是未来 3-5 年 AI 软件工程真正的主线。