Anthropic祭出「AI顾问」大招!Opus当军师只动嘴,小模型性能直接翻倍,成本暴降85%,近160万人围观

导读
【导读】Anthropic刚刚在Claude平台上线了Advisor Tool（顾问工具）：让便宜的Sonnet/Haiku当「执行者」全程干活，只在关键节点请Opus出来「指点一下」。结果？Sonnet加了顾问，SWE-bench成绩涨了2.7个百分点，成本反而降了12%。Haiku加了顾问更夸张——BrowseComp得分直接翻倍，成本只有Sonnet单跑的15%。官方推文浏览量近160万。

Opus不写代码了，它只「指方向」

4月9日，Anthropic在Claude官方博客低调发了一篇文章：《The advisor strategy: Give Sonnet an intelligence boost with Opus》。

标题看着平平无奇。但读完你会发现——这可能是今年API层面最实用的一次更新。

核心思路用一句话就能讲清楚：

让便宜的小模型一路干活，遇到难题的时候，抬头问一句贵模型该怎么走。

传统的多模型协作方案，通常是大模型当「总指挥」，把任务拆成小块分配给便宜模型执行。Anthropic这次反过来了——小模型全程掌舵，大模型只在关键节点被「请出来」给个方向，然后退场。

"This inverts a common sub-agent pattern... a smaller, more cost-effective model drives and escalates without decomposition, a worker pool, or orchestration logic. Frontier-level reasoning applies only when the executor needs it."

「这颠覆了常见的子智能体模式......更小、更便宜的模型全程主导推进，无需拆任务、无需工作池、无需编排逻辑。前沿级推理能力只在执行者需要时才启用。」

▲ @claudeai 官方宣布上线Advisor Strategy，浏览量158.6万，2.2万人点赞

说白了，以前是「老板拆活，小弟执行」；现在是「小弟自己干，实在搞不定了才去敲一下老板办公室的门」。

数据炸了：更强，居然还更便宜？

喊口号谁都会。关键是——数据怎么说？

Anthropic这次直接亮出了三个硬核基准测试。

第一组：Sonnet + Opus顾问 vs. Sonnet单打

在SWE-bench Multilingual（多语言软件工程基准）上：

Sonnet单跑：72.1%，每个任务成本 $1.09
Sonnet + Opus顾问：74.8%，每个任务成本$0.96

你没看错。成绩涨了2.7个百分点，成本反而降了11.9%。

▲ @claudeai 官方数据：Sonnet+Opus advisor 在SWE-bench Multilingual上得分74.8%，成本$0.96，双赢

为什么加了一个更贵的模型，总成本反而降了？因为Opus作为顾问，每次只输出400-700个文本token的短计划——相当于一段简短的战略指引。剩下所有的「脏活累活」全由便宜的Sonnet来干。而Sonnet有了更好的方向指引后，反而少走了弯路，减少了无效token消耗。

第二组：Haiku + Opus顾问——真正的「屌丝逆袭」

在BrowseComp（网页搜索基准）上：

Haiku单跑：19.7%
Haiku + Opus顾问：41.2%

性能直接翻倍还多。

▲ @scaling01 分享Advisor Tool在Sonnet和Haiku上的基准表现，173人点赞

更绝的是这组对比：Haiku+顾问的得分虽然比Sonnet单跑低了29%，但成本只有Sonnet的15%。

"Haiku with an Opus advisor trails Sonnet solo by 29% in score but costs 85% less per task."

「Haiku搭配Opus顾问的得分虽落后于Sonnet单跑29%，但每个任务的成本低了85%。」

这意味着什么？对于大批量、对精度要求没那么极端的场景——比如客服、文档处理、数据提取——Haiku+顾问可能是性价比的天花板。

一行代码搞定：开发者的福音

很多API级别的新功能，听起来美好，用起来要命——各种额外的编排逻辑、context管理、多轮调度。

Anthropic这次的设计简洁到令人发指。

你只需要在Messages API的`tools`数组里加一个对象：

```python response = client.messages.create( model="claude-sonnet-4-6", # 执行者 tools=[ { "type": "advisor_20260301", "name": "advisor", "model": "claude-opus-4-6", "max_uses": 3, },

], messages=[...] ) ```

就这样。一行配置，零编排逻辑。

整个过程在同一个`/v1/messages`请求内完成——Sonnet/Haiku在生成过程中自己决定什么时候该问顾问，服务器端自动跑一次Opus子推理，把结果塞回去，执行者继续干活。开发者完全不需要管中间的调度。

▲ @claudeai：「把advisor tool加到你的Messages API调用里。Sonnet或Haiku遇到难题时自动请教Opus，一个API请求搞定。」

计费也分得清清楚楚——顾问token按Opus价格算，执行者token按Sonnet/Haiku价格算，`usage`里分开报告。`max_uses`参数让你精确控制每次请求最多问几次顾问，成本完全可控。

当然也有两个坑要注意：顾问的输出不支持流式返回（stream会暂停等结果），以及多轮对话时如果移除了advisor tool但历史消息里还有`advisor_tool_result`，会触发400错误。官方建议达到预算上限时，同时清理tool定义和历史消息。

企业级客户已经用上了

Anthropic这次显然做了充足的准备——博客文章里直接放了三家企业客户的背书。

Bolt CEO Eric Simmons：

"It makes better architectural decisions on complex tasks while adding no overhead on simple ones. The plans and trajectories are night and day different."

「它在复杂任务上做出了更好的架构决策，对简单任务又没有额外开销。规划和执行轨迹的差异是天壤之别。」

Genspark联合创始人兼CTO Kay Zhu：

"We saw clear improvements in agent turns, tool calls, and overall score — better than a planning tool we built ourselves."

「我们在agent轮次、工具调用和总分上都看到了明显提升——比我们自己开发的规划工具还好。」

Eve Legal机器学习工程师Anuraj Pandey：

"On structured document extraction tasks, the advisor tool enables Haiku 4.5 to dynamically scale intelligence by consulting Opus 4.6 as complexity demands, matching frontier-model quality at 5× lower cost."

「在结构化文档提取任务中，advisor tool让Haiku 4.5能按需动态调用Opus 4.6的智能——以5倍低的成本达到前沿模型的质量。」

5倍低成本、天壤之别的提升——这些不是Anthropic自己在吹，是付费客户说的。

开发者社区的反应：有人兴奋，有人慌了

消息一出，X上炸了。

开发者@RhysSullivan的第一反应引人发笑：

"does this mean i have to rebrand"

「这意味着我得改名吗？」

▲ @RhysSullivan 看到Anthropic官方把advisor strategy做成产品后的第一反应——自己之前可能也在做类似的事

而@gilpinskyy更绝，直接甩了一张meme图——一个穿着「Claude Opus」牛仔服的人牵着一匹「Claude Sonnet」的马：

▲ @gilpinskyy：「顺便说一下，这就是幕后的真实场景。」Opus是牛仔（指挥），Sonnet是马（干活）。182人点赞

这张图精准捕捉了advisor strategy的精髓——牛仔不用自己跑，但他决定路线。

▲ @claudeai：「现已在Claude Platform上以beta形式提供。」827人点赞

这一招背后的深层信号

Advisor Tool看起来只是一个API功能更新。但如果你往深处想，会发现Anthropic正在释放一个重要信号：

模型的价值不再只看「谁跑得快、谁跑得准」，更看「谁会用、什么时候用」。

过去一年，AI行业的竞争叙事是：更大的模型、更高的benchmark。但Anthropic用数据证明了一件事——Sonnet加一个偶尔说两句话的Opus顾问，效果就已经逼近甚至超越Sonnet全力以赴的表现，而且更便宜。

Opus的价值从「端到端生成一切」变成了「在最关键的决策点给出最精准的判断」。这像什么？像公司里那个经验最丰富的技术总监——你不需要他写每一行代码，但关键的技术方案评审必须有他。

这对整个AI agent生态意味着什么？

构建agent的经济模型被重写了。以前你要么花大钱用最强模型保质量，要么用便宜模型省钱但接受质量下降。现在多了第三条路：便宜模型+偶尔请教贵模型=接近贵模型的质量+接近便宜模型的成本。

这个功能目前是beta状态，需要加`anthropic-beta: advisor-tool-2026-03-01`请求头才能使用。支持的组合包括Haiku 4.5、Sonnet 4.6和Opus 4.6之间的任意搭配。

Anthropic自己的建议是：跑一遍你现有的评测集，分别对比Sonnet单跑、Sonnet+Opus顾问、和Opus单跑的结果。数字会替你做决定。

— END —