【导读】Anthropic刚刚在Claude平台上线了Advisor Tool(顾问工具):让便宜的Sonnet/Haiku当「执行者」全程干活,只在关键节点请Opus出来「指点一下」。结果?Sonnet加了顾问,SWE-bench成绩涨了2.7个百分点,成本反而降了12%。Haiku加了顾问更夸张——BrowseComp得分直接翻倍,成本只有Sonnet单跑的15%。官方推文浏览量近160万。
Opus不写代码了,它只「指方向」
4月9日,Anthropic在Claude官方博客低调发了一篇文章:《The advisor strategy: Give Sonnet an intelligence boost with Opus》。
标题看着平平无奇。但读完你会发现——这可能是今年API层面最实用的一次更新。
核心思路用一句话就能讲清楚:
让便宜的小模型一路干活,遇到难题的时候,抬头问一句贵模型该怎么走。
传统的多模型协作方案,通常是大模型当「总指挥」,把任务拆成小块分配给便宜模型执行。Anthropic这次反过来了——小模型全程掌舵,大模型只在关键节点被「请出来」给个方向,然后退场。
"This inverts a common sub-agent pattern... a smaller, more cost-effective model drives and escalates without decomposition, a worker pool, or orchestration logic. Frontier-level reasoning applies only when the executor needs it."
「这颠覆了常见的子智能体模式......更小、更便宜的模型全程主导推进,无需拆任务、无需工作池、无需编排逻辑。前沿级推理能力只在执行者需要时才启用。」

▲ @claudeai 官方宣布上线Advisor Strategy,浏览量158.6万,2.2万人点赞
说白了,以前是「老板拆活,小弟执行」;现在是「小弟自己干,实在搞不定了才去敲一下老板办公室的门」。
数据炸了:更强,居然还更便宜?
喊口号谁都会。关键是——数据怎么说?
Anthropic这次直接亮出了三个硬核基准测试。
第一组:Sonnet + Opus顾问 vs. Sonnet单打
在SWE-bench Multilingual(多语言软件工程基准)上:
Sonnet单跑:72.1%,每个任务成本 $1.09 Sonnet + Opus顾问:74.8%,每个任务成本$0.96
你没看错。成绩涨了2.7个百分点,成本反而降了11.9%。

▲ @claudeai 官方数据:Sonnet+Opus advisor 在SWE-bench Multilingual上得分74.8%,成本$0.96,双赢
为什么加了一个更贵的模型,总成本反而降了?因为Opus作为顾问,每次只输出400-700个文本token的短计划——相当于一段简短的战略指引。剩下所有的「脏活累活」全由便宜的Sonnet来干。而Sonnet有了更好的方向指引后,反而少走了弯路,减少了无效token消耗。
第二组:Haiku + Opus顾问——真正的「屌丝逆袭」
在BrowseComp(网页搜索基准)上:
Haiku单跑:19.7% Haiku + Opus顾问:41.2%
性能直接翻倍还多。

▲ @scaling01 分享Advisor Tool在Sonnet和Haiku上的基准表现,173人点赞
更绝的是这组对比:Haiku+顾问的得分虽然比Sonnet单跑低了29%,但成本只有Sonnet的15%。
"Haiku with an Opus advisor trails Sonnet solo by 29% in score but costs 85% less per task."
「Haiku搭配Opus顾问的得分虽落后于Sonnet单跑29%,但每个任务的成本低了85%。」
这意味着什么?对于大批量、对精度要求没那么极端的场景——比如客服、文档处理、数据提取——Haiku+顾问可能是性价比的天花板。
一行代码搞定:开发者的福音
很多API级别的新功能,听起来美好,用起来要命——各种额外的编排逻辑、context管理、多轮调度。
Anthropic这次的设计简洁到令人发指。
你只需要在Messages API的`tools`数组里加一个对象:
```python response = client.messages.create( model="claude-sonnet-4-6", # 执行者 tools=[ { "type": "advisor_20260301", "name": "advisor", "model": "claude-opus-4-6", "max_uses": 3, },
], messages=[...] ) ```
就这样。一行配置,零编排逻辑。
整个过程在同一个`/v1/messages`请求内完成——Sonnet/Haiku在生成过程中自己决定什么时候该问顾问,服务器端自动跑一次Opus子推理,把结果塞回去,执行者继续干活。开发者完全不需要管中间的调度。

▲ @claudeai:「把advisor tool加到你的Messages API调用里。Sonnet或Haiku遇到难题时自动请教Opus,一个API请求搞定。」
计费也分得清清楚楚——顾问token按Opus价格算,执行者token按Sonnet/Haiku价格算,`usage`里分开报告。`max_uses`参数让你精确控制每次请求最多问几次顾问,成本完全可控。
当然也有两个坑要注意:顾问的输出不支持流式返回(stream会暂停等结果),以及多轮对话时如果移除了advisor tool但历史消息里还有`advisor_tool_result`,会触发400错误。官方建议达到预算上限时,同时清理tool定义和历史消息。
企业级客户已经用上了
Anthropic这次显然做了充足的准备——博客文章里直接放了三家企业客户的背书。
Bolt CEO Eric Simmons:
"It makes better architectural decisions on complex tasks while adding no overhead on simple ones. The plans and trajectories are night and day different."
「它在复杂任务上做出了更好的架构决策,对简单任务又没有额外开销。规划和执行轨迹的差异是天壤之别。」
Genspark联合创始人兼CTO Kay Zhu:
"We saw clear improvements in agent turns, tool calls, and overall score — better than a planning tool we built ourselves."
「我们在agent轮次、工具调用和总分上都看到了明显提升——比我们自己开发的规划工具还好。」
Eve Legal机器学习工程师Anuraj Pandey:
"On structured document extraction tasks, the advisor tool enables Haiku 4.5 to dynamically scale intelligence by consulting Opus 4.6 as complexity demands, matching frontier-model quality at 5× lower cost."
「在结构化文档提取任务中,advisor tool让Haiku 4.5能按需动态调用Opus 4.6的智能——以5倍低的成本达到前沿模型的质量。」
5倍低成本、天壤之别的提升——这些不是Anthropic自己在吹,是付费客户说的。
开发者社区的反应:有人兴奋,有人慌了
消息一出,X上炸了。
开发者@RhysSullivan的第一反应引人发笑:
"does this mean i have to rebrand"
「这意味着我得改名吗?」

▲ @RhysSullivan 看到Anthropic官方把advisor strategy做成产品后的第一反应——自己之前可能也在做类似的事
而@gilpinskyy更绝,直接甩了一张meme图——一个穿着「Claude Opus」牛仔服的人牵着一匹「Claude Sonnet」的马:

▲ @gilpinskyy:「顺便说一下,这就是幕后的真实场景。」Opus是牛仔(指挥),Sonnet是马(干活)。182人点赞
这张图精准捕捉了advisor strategy的精髓——牛仔不用自己跑,但他决定路线。

▲ @claudeai:「现已在Claude Platform上以beta形式提供。」827人点赞
这一招背后的深层信号
Advisor Tool看起来只是一个API功能更新。但如果你往深处想,会发现Anthropic正在释放一个重要信号:
模型的价值不再只看「谁跑得快、谁跑得准」,更看「谁会用、什么时候用」。
过去一年,AI行业的竞争叙事是:更大的模型、更高的benchmark。但Anthropic用数据证明了一件事——Sonnet加一个偶尔说两句话的Opus顾问,效果就已经逼近甚至超越Sonnet全力以赴的表现,而且更便宜。
Opus的价值从「端到端生成一切」变成了「在最关键的决策点给出最精准的判断」。这像什么?像公司里那个经验最丰富的技术总监——你不需要他写每一行代码,但关键的技术方案评审必须有他。
这对整个AI agent生态意味着什么?
构建agent的经济模型被重写了。以前你要么花大钱用最强模型保质量,要么用便宜模型省钱但接受质量下降。现在多了第三条路:便宜模型+偶尔请教贵模型=接近贵模型的质量+接近便宜模型的成本。
这个功能目前是beta状态,需要加`anthropic-beta: advisor-tool-2026-03-01`请求头才能使用。支持的组合包括Haiku 4.5、Sonnet 4.6和Opus 4.6之间的任意搭配。
Anthropic自己的建议是:跑一遍你现有的评测集,分别对比Sonnet单跑、Sonnet+Opus顾问、和Opus单跑的结果。数字会替你做决定。
— END —
夜雨聆风