
过去一年,AI Coding 圈最大的错觉之一,是大家以为:
«“只要模型越来越强,软件开发就会被彻底自动化。”»
但最近看完 flow-kit 和《十年老技术开发的 AI Agent 探索之路》之后,我越来越确信:
真正决定 AI 开发上限的,
已经不再是模型能力本身。
而是:
AI 软件工程系统能力。
这意味着,行业正在从:
Prompt Engineering
进入:
AI Software Engineering
甚至:
AI Operating System
时代。
---
一、AI Coding 正在从“聊天”进化成“系统”
过去的 AI Coding 模式,本质上是:
人
↔
AI 对话
↔
代码
核心依赖:
- Prompt 技巧
- 上下文长度
- 模型能力
- Agent 工作流
这种模式前期非常爽。
一句话生成页面。
几分钟搭完 Demo。
一个晚上写出 MVP。
但问题也很快暴露:
- AI 开始失忆
- 架构开始漂移
- 上下文越来越脏
- 重复踩坑
- 修改互相污染
- 长周期维护失控
很多人以为这是“模型不够强”。
但实际上:
这是软件工程问题。
不是模型问题。
---
二、真正的瓶颈,其实是“人”
《十年老技术开发的 AI Agent 探索之路》里有一个特别真实的场景:
作者同时开着:
- Claude
- Codex
- Gemini
- Cursor
多个终端并发开发。
看起来很先进。
但真实情况是:
- 忘了哪个 Agent 改了哪个分支
- 一个终端卡住十分钟没发现
- 文档和代码状态不同步
- AI 之间无法共享上下文
最终发现:
人脑的并发极限,大概就是 4-6 个 Agent。
再多就会开始崩溃。
于是作者得出了一个非常重要的结论:
«AI 的价值不是替代人,
而是让系统不再依赖人的实时在场。»
这句话非常关键。
因为它意味着:
AI 开发真正的问题,
已经不是“怎么生成代码”。
而是:
“怎么让 AI 长期稳定工作。”
---
三、80% 的 AI 需求,其实根本不需要 AI
这是文章里我最认同的一部分。
作者发现:
大量所谓“AI 需求”,本质上只是自动化需求。
比如:
- 定时任务
- 健康检查
- 日志分析
- 文件监听
- 数据同步
这些:
cron + curl + jq + shell
就能解决。
于是作者提出了一个非常经典的决策链:
目标
↓
代码
↓
CLI
↓
Prompt
↓
Agent
能在低层解决的问题,
绝不上推。
这是一个极其重要的工程认知。
因为现在 AI 圈有个很严重的问题:
“过度 Agent 化”。
很多东西:
10 行 Bash 就能解决。
结果硬套:
- LangChain
- Workflow
- Tool Calling
- Multi-Agent
最后:
复杂度暴涨,
稳定性下降,
成本翻倍。
本质上:
AI 不应该成为默认答案。
---
四、Vibe Coding 最大的问题:先易后难
这部分非常真实。
很多人第一次用 AI Coding 都会经历:
Day 1:
AI 太强了!
Day 7:
代码越来越乱。
Day 14:
开始怀疑人生。
Day 15:
被迫重构整个项目。
为什么?
因为 Vibe Coding 本质是:
“用未来的技术债,换今天的爽感。”
前期:
- 不写 spec
- 不做设计
- 不做约束
AI 看起来效率极高。
但后期:
- 架构漂移
- 抽象失控
- 重复逻辑
- 修改互相污染
于是作者最终回到了:
SDD(Spec-Driven Development)
即:
spec
→
plan
→
tasks
很多人误以为:
SDD 是“写文档”。
其实不是。
SDD 真正的价值是:
“把模糊目标逐步压缩成可执行状态。”
它让 AI:
- 可追踪
- 可恢复
- 可复盘
- 可治理
---
五、flow-kit 本质上在解决什么?
看完之后,我突然意识到:
flow-kit 真正厉害的地方,
不是“Prompt 模板”。
而是:
它在补 AI Coding 最大的缺口:
- 长期记忆
- 工程治理
- 状态管理
- 架构演化
- 失败恢复
比如:
PROGRESS.md
解决:
AI 失忆
---
LESSONS.md
解决:
重复踩坑
---
CONTEXT / ARCHITECTURE
解决:
架构漂移
---
RULES / Approval
解决:
AI 乱改
---
A-evolve
解决:
长期演化
所以 flow-kit 本质上已经不是:
AI Coding Tool
而是:
“轻量版 AI 软件工程操作系统”。
---
六、真正重要的,不再是模型,而是治理
文章里有一句话我印象特别深:
«“垃圾的思考 × 强大的模型 = 精美的垃圾。”»
这是现在 AI Coding 最大的问题。
很多人疯狂追:
- 最新模型
- 最大上下文
- 最强推理
但忽略了:
- observability
- eval
- runtime
- control plane
- 状态管理
- 权限治理
结果:
模型越强,
系统越不可控。
于是作者提出一个非常反直觉的观点:
“脚手架 > 模型。”
因为:
一个拥有:
- 规范
- 留痕
- 调度
- 状态
- 评估
- 治理
的系统。
即使用中等模型:
也可能远强于:
顶级模型 + 混乱工作流
---
七、行业真正的变化:从 Prompt 时代进入 Runtime 时代
现在行业已经开始出现明显趋势:
- MCP
- A2A
- Responses API
- Agent Runtime
- Multi-Agent Coordination
这些东西意味着:
行业重点正在从:
Prompt Engineering
转向:
“AI Runtime + Protocol + Control Plane”。
未来真正值钱的:
不一定是:
谁更会写 Prompt
而是:
谁更懂:
- Runtime
- 协议
- 状态
- 调度
- 评估
- 多 Agent 协作
- 工程治理
因为:
AI 正在从工具,进化成系统。
---
八、最终形态:Goal-Driven AI Software Engineering
文章最后一个非常重要的认知跃迁:
从:
Task-Driven
进入:
Goal-Driven
区别是:
以前:
人派任务
AI执行
未来:
人定义目标
系统自主推进
这已经不是:
“AI 帮你写代码”。
而是:
“AI 团队”。
未来可能会出现:
- Architect Agent
- Backend Agent
- Frontend Agent
- QA Agent
- Security Agent
- DevOps Agent
- Review Agent
而:
- flow-kit 负责规范
- Runtime 负责调度
- MCP/A2A 负责通信
- Goal-Driven 负责推进
- Human 负责目标与边界
这其实已经越来越像:
AI 软件工程操作系统。
---
九、最后一句话
过去:
AI 是工具。
现在:
AI 是协作者。
未来:
AI 会成为长期运行的软件工程系统。
而真正决定未来上限的,
不再是模型参数。
而是:
- 规范
- Runtime
- 状态
- 治理
- 协议
- Eval
- Observability
- Goal-Driven
这可能才是未来 3-5 年 AI 软件工程真正的主线。
夜雨聆风