AI Agent 的算力成本与长久应用方案

最近实际使用下来，越来越明显地感觉到：AI Agent 已经不只是 Coding 工具，而是开始具备处理复杂任务的能力。

根据实际经验，大多 Agent 支持子代理的方式并行执行任务。这种一主多子的并行方式无需特别要求，当任务复杂耗时，Agent 默默就拆分子代理执行了。主观上感觉有时执行慢，展开任务详情可能发现是在等待子代理的执行结果。

而另一种多主 Agent 并行的团队协作方式，执行速度会快很多，消耗词元的速度和数量也多得多。以 CC 的 20 刀套餐为例，一个大任务开启 Team 模式，一个问题可能就消耗了 5 小时的用量，但收效也很明显，几分钟内完成单代理至少半小时以上的任务，Codex 可用时长稍微多一点点。

之前的文章分享过AI Coding 正在进入 Agent-First 时代：程序员该如何升级？‌，未来 AI Coding 趋势是 Codex 这种电脑接管软件交付。比如今天早上发现电脑夜晚发热问题，授权电脑完全权限，从系统日志、活动扫描，到程序进程排查等等，再到最终的分析结论，采纳建议后自动删除程序，异常唤醒 App 设置配置处理，以及后续观察点建议结束，20 刀订阅的 5 小时用量只剩 2% 了。

这个案例真正说明的不是省了多少时间，而是 Agent 已经能进入真实电脑环境处理复杂问题。

到这应该发现问题了，AI Agent 的智能程度足以处理复杂任务，不只是 Coding。如果需要效率，则并行代理。

当然用量结束，要么等额度刷新，要么充钱继续按量计费。如果是 100 刀或顶配 200 刀，也会有等价值的任务，问题依然在于成本与价值的取舍。

当思考这个问题时，成本本身已经阻碍了更大程度的智能体使用。

短期的 AI 算力稀缺是事实，从 Coding Plan 到 Token Plan 可见一角。有的大厂停售基础套餐，直接起售更贵的 Pro 套餐；有的想买都抢不到，但 AI 的应用只会加速扩张到千行百业。

DeepSeek V4 已经发布，虽不是顶尖，但能接近 Claude 上一代顶级模型智能程度。极低的价格足以应对绝大多数场景，而且未来国产适配价格仍有大幅下降空间。当用量焦虑被极大降低，AI 应用的频率只会更高。

回到实际应用场景，智能体等于大模型加控制系统。顶级的驾驭层 Claude Code，加丰富的周边扩展生态（小龙虾只是通信方便点），叠加低成本高效率的大模型 DS，短期甚至长期都是最佳方案。Claude Code 叠加 CC Switch，或者直接修改 CC 配置，都可以轻松接入三方模型，不只 DS 模型。虽然 Codex 的桌面控制能力突出，但是长效的实际应用才有价值。

按我的使用方式粗略估算，极少数的时候需要更智能的模型再切换，但成本大多数人可以接受了。60% 的成本花费在更智能的模型，覆盖 20% 左右的场景；剩下的 40% 的成本花费在 DS 等高效模型，覆盖 80% 的场景，总体可以控制在 200 元以内了。

不重要的任务，OpenRouter 上还有很多免费的模型可选。近期腾讯的新模型发布免费试用，还有前阵子的小米模型发布也有免费试用期，英伟达的长期有免费模型可试用，进一步降低成本。

前面讲的算力成本问题解决后，如何更高质量地应用智能体，不是说小白的 Vibe Coding。对于非专业应用场景，靠聊天是可以做出产品的，尤其对不懂编程的人是巨大的跨越。

如果需要长久的应用，必然是需要持续可维护的。Claude Code 近期发文从 MD 转 HTML，是为了让 AI 产出更适合分享阅读，核心是为了在人和 AI 协作中要回主导地位。如果 AI 的产出人不愿意去看，那么很可能会成为垃圾堆，最终变得失控。

为了更好地和 AI 协作，一套 SOP 是必要的。GitHub 上有很多的开源 AI 工作流流程，大都是围绕 Claude Code 生态的扩展，搜索 Claude Code 就有很多选择。自己也有集采组合了一套工作流，相信随着应用深入，每个人都应该形成自己的一套流程。

工作流规范了和 AI 的协作，能够达到高质量的产出，主导权要回来了，焦点也回到了人身上。至少我自己是单进程的，一次专注一件事，但是 Agent 可以多任务并行，最终还是使用 AI 的人决定了 AI 的上限。

为了提高工作效率，逐渐适应能并行做 2 件事，同时做多个项目。当然不是吃饭玩手机这种，而是同时吃 2 桌饭玩手机，等菜的间隙换桌，如此切换。