最近实际使用下来,越来越明显地感觉到:AI Agent 已经不只是 Coding 工具,而是开始具备处理复杂任务的能力。
根据实际经验,大多 Agent 支持子代理的方式并行执行任务。这种一主多子的并行方式无需特别要求,当任务复杂耗时,Agent 默默就拆分子代理执行了。主观上感觉有时执行慢,展开任务详情可能发现是在等待子代理的执行结果。
而另一种多主 Agent 并行的团队协作方式,执行速度会快很多,消耗词元的速度和数量也多得多。以 CC 的 20 刀套餐为例,一个大任务开启 Team 模式,一个问题可能就消耗了 5 小时的用量,但收效也很明显,几分钟内完成单代理至少半小时以上的任务,Codex 可用时长稍微多一点点。
之前的文章分享过AI Coding 正在进入 Agent-First 时代:程序员该如何升级?,未来 AI Coding 趋势是 Codex 这种电脑接管软件交付。比如今天早上发现电脑夜晚发热问题,授权电脑完全权限,从系统日志、活动扫描,到程序进程排查等等,再到最终的分析结论,采纳建议后自动删除程序,异常唤醒 App 设置配置处理,以及后续观察点建议结束,20 刀订阅的 5 小时用量只剩 2% 了。
这个案例真正说明的不是省了多少时间,而是 Agent 已经能进入真实电脑环境处理复杂问题。
到这应该发现问题了,AI Agent 的智能程度足以处理复杂任务,不只是 Coding。如果需要效率,则并行代理。
当然用量结束,要么等额度刷新,要么充钱继续按量计费。如果是 100 刀或顶配 200 刀,也会有等价值的任务,问题依然在于成本与价值的取舍。
当思考这个问题时,成本本身已经阻碍了更大程度的智能体使用。
短期的 AI 算力稀缺是事实,从 Coding Plan 到 Token Plan 可见一角。有的大厂停售基础套餐,直接起售更贵的 Pro 套餐;有的想买都抢不到,但 AI 的应用只会加速扩张到千行百业。
DeepSeek V4 已经发布,虽不是顶尖,但能接近 Claude 上一代顶级模型智能程度。极低的价格足以应对绝大多数场景,而且未来国产适配价格仍有大幅下降空间。当用量焦虑被极大降低,AI 应用的频率只会更高。
回到实际应用场景,智能体等于大模型加控制系统。顶级的驾驭层 Claude Code,加丰富的周边扩展生态(小龙虾只是通信方便点),叠加低成本高效率的大模型 DS,短期甚至长期都是最佳方案。Claude Code 叠加 CC Switch,或者直接修改 CC 配置,都可以轻松接入三方模型,不只 DS 模型。虽然 Codex 的桌面控制能力突出,但是长效的实际应用才有价值。
按我的使用方式粗略估算,极少数的时候需要更智能的模型再切换,但成本大多数人可以接受了。60% 的成本花费在更智能的模型,覆盖 20% 左右的场景;剩下的 40% 的成本花费在 DS 等高效模型,覆盖 80% 的场景,总体可以控制在 200 元以内了。
不重要的任务,OpenRouter 上还有很多免费的模型可选。近期腾讯的新模型发布免费试用,还有前阵子的小米模型发布也有免费试用期,英伟达的长期有免费模型可试用,进一步降低成本。
前面讲的算力成本问题解决后,如何更高质量地应用智能体,不是说小白的 Vibe Coding。对于非专业应用场景,靠聊天是可以做出产品的,尤其对不懂编程的人是巨大的跨越。
如果需要长久的应用,必然是需要持续可维护的。Claude Code 近期发文从 MD 转 HTML,是为了让 AI 产出更适合分享阅读,核心是为了在人和 AI 协作中要回主导地位。如果 AI 的产出人不愿意去看,那么很可能会成为垃圾堆,最终变得失控。
为了更好地和 AI 协作,一套 SOP 是必要的。GitHub 上有很多的开源 AI 工作流流程,大都是围绕 Claude Code 生态的扩展,搜索 Claude Code 就有很多选择。自己也有集采组合了一套工作流,相信随着应用深入,每个人都应该形成自己的一套流程。
工作流规范了和 AI 的协作,能够达到高质量的产出,主导权要回来了,焦点也回到了人身上。至少我自己是单进程的,一次专注一件事,但是 Agent 可以多任务并行,最终还是使用 AI 的人决定了 AI 的上限。
为了提高工作效率,逐渐适应能并行做 2 件事,同时做多个项目。当然不是吃饭玩手机这种,而是同时吃 2 桌饭玩手机,等菜的间隙换桌,如此切换。
夜雨聆风