Claude 6月15日计费拆分,自动化调用单独收钱,有人一夜被烧$6000;Gemini终于出了Mac客户端,100天100+功能,但代理能力还差一截;Codex周活突破400万开发者,token计费模式让成本变得不可预测。单一模型崇拜结束了,混合调度才是出路——问题是,你搭得起这套体系吗?
早上打开Anthropic控制台,发现昨晚跑的一个自动化脚本,一夜之间烧掉了$6000。不是系统bug,不是被人盗号,就是你的AI助手太勤奋了。
这是5月份真实发生的事。而类似的故事,正在全球开发者圈子里批量上演。
2026年5月,桌面AI市场的格局发生了剧烈变化。Claude用户因为账单暴增开始逃亡,Gemini打破不做客户端的传统紧急推出Mac版,Codex意外逆袭。一个旧共识正在崩塌:不存在一个"最好的"AI工具,只有"最合适的组合"。
▌Claude:从"首选"到"最贵"的坠落
4月份,Claude还是开发者的心头好。到了5月,画风突变。
5月14日,Anthropic同时宣布了两件事:Claude Code每周限额临时上调50%(持续到7月13日);同一天,另一份公告说——从6月15日起,Agent SDK、claude -p命令、GitHub Actions、以及所有第三方Agent工具的使用量,将全部从订阅池里拆出来,按API全价单独计费。
一边给你加额度,一边悄悄改了计费规则。翻译成人话:你以为工资翻倍了,结果加班费另算,而且单价还涨了。
💸 Claude账单暴增的三大元凶
更狠的是,4月21日有人发现Pro计划($20/月)的Claude Code访问权被静默移除——没有公告,没有邮件,就是定价页上悄悄换了个叉号。虽然后来改回去了,但官方文档里最低门槛已标注为Max 5x($100/月)。从$20到$100,门槛涨了4倍。

▌Gemini:最晚进场,但来势汹汹
4月15日,Google终于发布了Gemini的Mac原生客户端——这是三大AI助手中最晚的一个。ChatGPT在2024年5月就有了Mac版,Claude同年10月跟上,Gemini晚了将近一年。
但Google这次明显是有备而来:100%原生Swift开发,100天100+功能,不是Electron套壳。全局快捷键Option+Space随时唤醒,还能共享当前窗口内容实时辅助。
I/O 2026大会上,Google又宣布了Gemini Spark——一个24/7在线的个人AI代理,能操作本地文件、自动化桌面工作流。选中文件后口述邮件内容,Gemini自动填入Gmail撰写窗口。这已经从"聊天助手"进化成了"桌面管家"。
🆓 Gemini最大的杀手锏:免费
客户端免费,基础版Gemini 3.1 Pro免费,1M token上下文免费。Pro档$19.99/月跟ChatGPT Plus同价,但免费版的能力就已经很强了。对预算敏感的开发者来说,这是目前最划算的起步选择。
当然,短板也很明显:没有Gemini Live、没有聊天文件夹、不支持多账户切换。代理能力也还跟不上——ChatGPT能操作应用内功能,Gemini目前只能读屏幕回答问题,不能替你执行操作。
▌Codex:意外逆袭的黑马
OpenAI的Codex,可能是2026年增长最快的AI开发工具。周活开发者突破400万,非编程任务占比已经达到51%——超过一半的用户不是在写代码,而是在调文档、做表格、跑自动化。
Codex的逆袭靠的不是某一项黑科技,而是云沙箱+并行代理+插件生态的组合拳:
- 云沙箱:每个任务独立运行在云端容器,不碰本地环境,安全无忧
- 并行代理:同时跑3-5个任务,一个修bug、一个写测试、一个重构
- 90+插件:Jira、CircleCI、GitLab、CodeRabbit全覆盖
- CI/CD自动化:构建失败自动诊断修复,排期任务定期执行
但4月2日起改了token计费模式后,成本变得不可预测。Plus档$20/月只能轻度使用,认真干活的大多在$100-200/月。Pro档$200/月才基本放开限制。
▌三大工具横评:谁适合什么?
| 维度 | Claude | Gemini | Codex |
|---|---|---|---|
| 核心优势 | 深度推理+长上下文 | 免费+大上下文 | 云沙箱+并行代理 |
| 致命缺陷 | 天价账单+计费暗改 | 代理能力不足 | token计费不可预测 |
| 最佳场景 | 架构设计/复杂分析 | 需求梳理/文档处理 | 批量编码/CI自动化 |
| 免费额度 | 有限 | 充裕 | 有限 |
| 月均成本(重度) | $100-200+ | $0-20 | $100-200 |
| Mac客户端 | ✅ 2024.10 | ✅ 2026.4 | 网页端 |
▌实战:混合调度工作流
单一模型崇拜结束了。聪明人的做法是按任务复杂度智能路由:
☀️ 日间攻坚:Claude处理核心架构设计(精准度最高),Codex批量跑重复性编码任务(效率翻倍)
🌙 夜间维护:Codex自动化测试+报告生成,设置熔断机制避免无限循环烧钱
▌成本控制:三条保命规则
不管你用哪个工具,这三条必须守住:
1. 强制超时设置
所有自动化任务设30分钟硬上限。那个一夜$6000的惨案,就是脚本每30分钟跑一轮,没有退出条件,缓存还过期了。
2. 用国产模型降本
DeepSeek V4-Pro API永久降价75%,每百万tokens输入0.025元、输出6元。简单任务走国产模型,复杂任务才上Claude/Codex,成本能降90%。
3. 看住Claude的"深度思考"
Opus 4.7的扩展思考模式,单次调用推理token可能到20K,光推理费就$0.60。而且新分词器会让同等文本多吃35% token——你不知道的隐性涨价,比明面上的提价更可怕。
⚠️ 三大隐形账单陷阱
Claude:6月15日后Agent SDK单独计费,$20 Pro只包含$20的API额度,超出自费。7月13日50%临时提额到期,到时候双重夹击。
Codex:浏览器自动化任务可能引发token雪崩,尤其是长上下文场景。Plus档的重度用户实际月费远超$20。
Gemini:免费版单日约50次调用限制,高峰期需排队。Spark代理功能锁定$100/月Ultra档。
💡 我的观点
桌面AI正在从"单一模型崇拜"转向"混合调度时代"。
这不是选择题,而是架构题。就像微服务取代单体应用一样,多模型协同正在取代"选一个最好的AI"。
掌握API调度能力的人,会比只会用一个工具的人,节省90%的成本,获得3倍的产出。这不是效率差距,这是阶层差距。
建议立即动手:建一个自己的调度体系,哪怕只是简单的if-else路由。早一天搭建,早一天省钱。
你现在在用什么AI工具?月费多少?评论区聊聊,看看谁被割得最狠。
👇 关注「观星纪. StarEpoch」,持续输出最前端的AI信息
解读AI动态 · 分享实用工具 · 一起拥抱新趋势

长按识别二维码
夜雨聆风