
我有个毛病,看到账单就头皮发麻。
前天翻了一下上个月的AI编程支出。Claude Max 20x每月200美元,Fable的API调用又烧了大概300多。加上Cursor、Copilot乱七八糟的订阅,月均花在AI编程上的钱快破万了。
我这还是个体户。你有11个AI员工在跑——虽然那是我另外一篇文章的事了——但每天的token消耗如果全走Fable,我算过,一个月至少要花两万。
所以当SemiAnalysis那篇报告出来的时候,我读了三遍。
他们买了Anthropic和OpenAI的全部订阅方案,模拟高强度的编码任务,一路测到每周限额。结论是:月费200美元的Claude Max 20x,如果用API价格换算,能烧掉将近14000美元等值的token。
14000除以200,70倍。
这就好比你花200块买了张自助餐券,然后你吃了价值14000块的和牛。
但这只是整张拼图的第一块。我这周还看到了另外两个东西,把它们拼在一起,我终于搞明白了一件事——AI编程的成本结构,正在被彻底重构。

先聊聊SemiAnalysis这篇报告。他们做的事很简单:把市面上的付费方案全买了一遍,然后用真实的高强度开发任务去压榨,看哪个方案最划算。
几个关键发现。
第一,Anthropic的订阅方案性价比碾压一切。Claude Max 20x月费200刀,但你能消耗的token量如果按API价格折算,价值在8000到14000刀之间。差的这6000,取决于你做什么。做代码生成和调试,消耗量最大,性价比也最高。
第二,OpenAI的方案在重度代码任务上明显不如Anthropic。不是模型不行,是配额设计更保守。
第三,也是我觉得最有意思的:这些定价方案本身就在补贴重度用户。Anthropic和OpenAI都在用订阅收入补贴API成本,赌的是多数用户不会用满配额。但如果你是一个每天写8小时代码的人——你就是在吃他们的补贴。
这事让我想明白一个道理:做AI编程,跟租房子一样。位置——就是你用的频率——决定一切。轻度用户API按量付费就够了,重度用户不用订阅方案就是白扔钱。
然后是这周让我最兴奋的东西:OpenRouter的Fusion API。
原理说穿了很简单。它不是用一个模型回答你的问题,而是把你的问题同时发给多个模型——可能是Opus、GPT-5.5、Gemini 3——让它们各自生成答案,然后由第四个"裁判模型"来合成最终结果。
听起来像在浪费token?错了。
因为构成Fusion底座的三个"小模型",每个的单价都远低于Fable。但它们的答案经过裁判模型合成后,质量居然逼近了Fable。
更让我震惊的是"预算版"的测试结果。用Gemini 3 Flash、Kimi K2.6、DeepSeek V4 Pro三个模型组成的Fusion——这三个都是远低于前沿价格的模型——合成出来的结果,居然超过了单个Claude Fable 5。
我把日常的一些代码任务扔给Fusion API,包括写单元测试、review代码、生成数据库迁移脚本。坦白说,80%的任务质量跟Fable没本质区别。剩下20%,Fable确实更强,但强的那部分值不值两倍价钱?我不觉得值。
Fusion API做对了一件事:它把"用更便宜的模型组合出更贵模型的效果"这个思路,做成了一行API调用。
然后是本周Hacker News上炸开的这个项目:/architect。
这个项目背后的逻辑,比Fusion API更激进。
Fusion API的思路是用多个便宜模型去逼近一个贵模型。而/architect的思路是:Fable只负责设计和审核,具体的构建工作全部交给Codex。
它的工作流程是这样的:
Fable读你的需求,设计出完整的架构方案——模块划分、接口定义、数据结构、测试策略。这一步,Fable只做了"思考",没有写一行代码。token消耗很小。
Codex拿过Fable的设计方案,开始写代码。Codex的token单价大概只有Fable的十分之一。它写代码很快,但质量不稳定。没关系,Fable会审核。
Fable审核Codex的产出——只检查逻辑正确性、架构一致性、潜在bug。这一步的token消耗比第二步还要小。
如果审核通过,代码提交。不通过,Fable给出修改建议,Codex重新生成。
整个流程下来,Fable的token消耗比直接让它写代码减少了80%。
80%是什么概念?我之前每个月烧在Fable API上的300多美元,换成/architect模式,大概只需要60刀。加上Codex的消耗,总共不到100刀。直接省了三分之二。
我已经在自己的项目里用了三天/architect。几点真实感受。
第一,Fable做架构设计确实比写代码强。让它设计模块划分、数据流、错误处理策略,它想得比我细。但让它一行行写出来,它的代码经常"自我发挥",弄一些看起来很聪明但实际没必要的抽象。
第二,Codex写代码比Fable快。纯粹的执行层面,Codex明显更高效。它不纠结,不啰嗦,不等你问"要不要写注释",刷刷刷就出来了。大部分时候质量过关,偶尔会翻车——这时候Fable的审核就体现价值了。
第三,最难的其实是分好"设计"和"执行"的边界。有些东西你以为是"执行",其实需要Fable级别的判断力。比如错误处理的具体策略、第三方API的调用方式、数据库查询的优化——这些你让Codex自己判断,十次里有三次它会选错方案。所以/architect的配置文件很重要,什么交给Fable、什么交给Codex,得调。

把三块拼图拼在一起看。
SemiAnalysis告诉我:用订阅方案,token成本可能只有API的1/70。Fusion API告诉我:用复合模型,质量不降,价格减半。/architect告诉我:用设计+执行分工,Fable用量砍掉80%。
这三个改善,不是加法关系,是乘法关系。
假设我原来只用Fable API直接写代码,一个月成本1000美元。用上订阅方案,月费200。加入Fusion API处理非核心任务,把Fable的用量再砍一部分。再加上/architect,Fable只做设计。
一叠加,一个月从1000美元变成了大概——算了不细算了,反正降到了之前的15%到20%。
我之前觉得AI编程贵。现在我发现,不是贵,是我没用对。
说点实在的,我自己的实操建议。
第一,如果你是重度用户,先去开Claude Max 20x。不管你用不用/architect,订阅方案的token量如果你能用满,性价比是API的几十倍。前提是你真的每天都要大量用。一周用两三次的话,老老实实走API按量付费。
第二,Fusion API适合做"第二层"。把Fable留给最复杂、最需要精确判断的任务。日常的代码生成、测试、文档、小修小补,用Fusion就够了。反正一个月下来,质量差异你基本感觉不到。
第三,/architect有学习成本,但值得。前三天你会觉得很别扭——明明可以让Fable直接写,为什么要绕一圈?但习惯了之后,你会发现自己对代码的掌控感反而变强了。因为设计是你跟Fable一起做的,执行是Codex照着设计来的,中间没有黑箱。
第四,别指望一套方案吃一辈子。这些工具和方案都在快速迭代。Fusion API今天半价,下周可能有更好的组合。Fable Max的配额今天松,下个月可能收紧。保持信息敏感度,比固定一套方案重要得多。
最后说句实话。
很多人问我:杨宗主,你觉得AI编程工具会不会很快变得"几乎免费"?
我以前觉得不会。现在我觉得——不会"免费",但会趋近一个合理的成本线。就跟云服务器一样,10年前贵得离谱,现在价格稳定在一个能支撑行业运转的水平。
AI编程也是这个逻辑。工具和方案的迭代,不是在消灭成本,是在把成本压到让更多人用得起。
你看到了吗?从SemiAnalysis的70倍杠杆,到Fusion的半价,到/architect的80%削减——每一层都在把门槛往下拉。
谁先用上这些方法,谁就能在别人还在按原价烧token的时候,悄悄走到前面去。
如果这篇文章对你有启发,点击上方蓝字「杨宗主」关注我。
每周持续更新AI操盘实战笔记,不吹不装,只说真话。
夜雨聆风