一个参数量只有GPT-5零头的小模型,指挥GPT-5、Claude、Gemini一起干活,成绩全面碾压它们每一个单干。
这是昨天刷到的一篇论文。看完愣了好一会儿。
这个7B的小家伙,靠强化学习学会了三件事。
把复杂任务拆成子问题,选最合适的大模型去执行,然后告诉它该看哪些上下文。
平均每道题只调用三次,比人工设计的复杂流程还利索。
一个笨的,指挥一群聪明的,赢了。
我脑子里立刻蹦出一个词:养虾的领导力。
这是我在线下课上反复讲的一个概念。
简单说就是,你不需要比你的AI更聪明,你需要的是能把活拆清楚、把AI用对。
就像养虾,你不用下水自己游,但你得知道水温多少度、什么时候喂食、什么时候该换水。
这篇论文,等于用最硬核的实验数据,替这个概念做了一次科学验证。

其实二十多年前,就有人用一场棋赛证明过同样的事。
1997年,深蓝击败了国际象棋世界冠军卡斯帕罗夫。
全世界都觉得人类棋手完了。但卡斯帕罗夫没认输,搞了个新比赛,人可以用电脑辅助下棋。
结果最强的组合,不是顶尖大师配最强AI,是两个业余棋手,加上三台普通电脑。
棋力一般,但他们特别擅长一件事,知道什么时候该听电脑的,什么时候该自己判断,怎么把几台电脑的建议整合成最优决策。
指挥能力,比任何单点的聪明程度都值钱。
这道理,二十多年前就被证明过了。今天又被证明了一次。
我自己也有一个特别具体的体感。
有一天晚上,我花了大概十分钟,给我的总助知行(龙虾)派了个活。十分钟里我只做了三件事。
把任务拆清楚。这份报告需要哪几个板块,每个板块的交付标准是什么。
把上下文给够。背景资料、历史数据、客户需求,一次性喂进去。
定好底线。哪些信息不能错,剩下的你自己发挥。
然后,我去睡觉了。
第二天早上8点,它交付了3份PDF,将近100页。中间我一句话没说,它自己发现了问题,还主动迭代了一版。
十分钟的指挥,换来一整夜的交付。
你看,这跟那篇论文里7B小模型干的事,一模一样。
拆任务、选人、给上下文。
不自己解题,只负责指挥。

我在线下课上经常问一个问题:你用AI的方式,是自己跟ChatGPT聊天,还是搭了一个系统让AI各司其职?
90%的老板是第一种。
自己亲手跟AI对话,一个问题聊半小时,改来改去,出来的东西勉强能用。
这就好比CEO自己去写代码。能跑是能跑,但你一个月能写几个功能?
今年5月,我跟一个帮保险行业用AI的朋友深聊了90分钟。
他5个月,帮3万多保险从业者用上了AI。他自己几乎不跟AI对话。
他搭了一套铁三角获客系统,让AI在体系里各司其职。
他本人呢,主要精力花在判断方向、设计体系、做最终决策。
不管是论文里的7B模型、棋盘上的业余棋手,还是我和这个朋友,做的其实是同一件事:不亲自干,只负责拆任务、选对的人或AI、给清楚的上下文。
这就是养虾的领导力。
斯坦福2026年的AI指数报告有个数据:中美顶级模型的性能差距,已经缩小到2.7%。
GPT-5、Claude、Gemini、DeepSeek,聪明程度差不太多了。
那差距在哪?
在用它们的人身上。
同样的模型,有人用来做出了持续收费的产品,有人做PPT代写,改了三版客户还是退单。
模型一模一样,结果天差地别。
我前两天写过一篇文章,说AI替代不了的就一件事。
你的审美。
审是判断力、决策力、担责任。
美是感知力,知道什么是好的。
指挥能力,其实就是审美落地的具体动作。
你清楚什么该做什么不该做,也能判断哪个AI适合干哪件事。
任务拆好分好,让它们各自发挥就行。
以前带人,以后带AI。但本质上,领导力这东西没变过。

最后说一个数。
全国能干AI商业操盘这个活的人,根据我的观察,目前不到11000个。得懂AI,也得懂生意,还得能管人管流程。
这篇论文告诉我们一件事:未来最稀缺的,是会指挥AI的人。
那个7B的小家伙,参数量不到GPT-5的零头,却赢了所有大模型。它赢在指挥。
人越强,AI越强。
你不需要比AI更聪明。你需要的是养虾的领导力,知道该让谁干什么,然后放手让它去干。
我见过有圈友就靠这套逻辑,2个月搭了3个AI员工,把自己从每天12小时的干活状态里解放出来,现在精力全放在谈客户上,收入翻了3倍。
以上,既然看到这里了,如果觉得有用,随手点个赞、在看、转发三连吧。
想第一时间收到文章,记得给我个星标⭐️~谢谢你看我的文章,我们,下次见。
本周六线下聚会(闭门会)预告,聚一下子。

夜雨聆风