离谱!一个笨AI指挥ChatGPT干活,凭啥赢

一个参数量只有GPT-5零头的小模型，指挥GPT-5、Claude、Gemini一起干活，成绩全面碾压它们每一个单干。

这是昨天刷到的一篇论文。看完愣了好一会儿。

这个7B的小家伙，靠强化学习学会了三件事。

把复杂任务拆成子问题，选最合适的大模型去执行，然后告诉它该看哪些上下文。

平均每道题只调用三次，比人工设计的复杂流程还利索。

一个笨的，指挥一群聪明的，赢了。

我脑子里立刻蹦出一个词：养虾的领导力。

这是我在线下课上反复讲的一个概念。

简单说就是，你不需要比你的AI更聪明，你需要的是能把活拆清楚、把AI用对。

就像养虾，你不用下水自己游，但你得知道水温多少度、什么时候喂食、什么时候该换水。

这篇论文，等于用最硬核的实验数据，替这个概念做了一次科学验证。

其实二十多年前，就有人用一场棋赛证明过同样的事。

1997年，深蓝击败了国际象棋世界冠军卡斯帕罗夫。

全世界都觉得人类棋手完了。但卡斯帕罗夫没认输，搞了个新比赛，人可以用电脑辅助下棋。

结果最强的组合，不是顶尖大师配最强AI，是两个业余棋手，加上三台普通电脑。

棋力一般，但他们特别擅长一件事，知道什么时候该听电脑的，什么时候该自己判断，怎么把几台电脑的建议整合成最优决策。

指挥能力，比任何单点的聪明程度都值钱。

这道理，二十多年前就被证明过了。今天又被证明了一次。

我自己也有一个特别具体的体感。

有一天晚上，我花了大概十分钟，给我的总助知行（龙虾）派了个活。十分钟里我只做了三件事。

把任务拆清楚。这份报告需要哪几个板块，每个板块的交付标准是什么。

把上下文给够。背景资料、历史数据、客户需求，一次性喂进去。

定好底线。哪些信息不能错，剩下的你自己发挥。

然后，我去睡觉了。

第二天早上8点，它交付了3份PDF，将近100页。中间我一句话没说，它自己发现了问题，还主动迭代了一版。

十分钟的指挥，换来一整夜的交付。

你看，这跟那篇论文里7B小模型干的事，一模一样。

拆任务、选人、给上下文。

不自己解题，只负责指挥。

我在线下课上经常问一个问题：你用AI的方式，是自己跟ChatGPT聊天，还是搭了一个系统让AI各司其职？

90%的老板是第一种。

自己亲手跟AI对话，一个问题聊半小时，改来改去，出来的东西勉强能用。

这就好比CEO自己去写代码。能跑是能跑，但你一个月能写几个功能？

今年5月，我跟一个帮保险行业用AI的朋友深聊了90分钟。

他5个月，帮3万多保险从业者用上了AI。他自己几乎不跟AI对话。

他搭了一套铁三角获客系统，让AI在体系里各司其职。

他本人呢，主要精力花在判断方向、设计体系、做最终决策。

不管是论文里的7B模型、棋盘上的业余棋手，还是我和这个朋友，做的其实是同一件事：不亲自干，只负责拆任务、选对的人或AI、给清楚的上下文。

这就是养虾的领导力。

斯坦福2026年的AI指数报告有个数据：中美顶级模型的性能差距，已经缩小到2.7%。

GPT-5、Claude、Gemini、DeepSeek，聪明程度差不太多了。

那差距在哪？

在用它们的人身上。

同样的模型，有人用来做出了持续收费的产品，有人做PPT代写，改了三版客户还是退单。

模型一模一样，结果天差地别。

我前两天写过一篇文章，说AI替代不了的就一件事。

你的审美。

审是判断力、决策力、担责任。

美是感知力，知道什么是好的。

指挥能力，其实就是审美落地的具体动作。

你清楚什么该做什么不该做，也能判断哪个AI适合干哪件事。

任务拆好分好，让它们各自发挥就行。

以前带人，以后带AI。但本质上，领导力这东西没变过。

最后说一个数。

全国能干AI商业操盘这个活的人，根据我的观察，目前不到11000个。得懂AI，也得懂生意，还得能管人管流程。

这篇论文告诉我们一件事：未来最稀缺的，是会指挥AI的人。

那个7B的小家伙，参数量不到GPT-5的零头，却赢了所有大模型。它赢在指挥。

人越强，AI越强。

你不需要比AI更聪明。你需要的是养虾的领导力，知道该让谁干什么，然后放手让它去干。

我见过有圈友就靠这套逻辑，2个月搭了3个AI员工，把自己从每天12小时的干活状态里解放出来，现在精力全放在谈客户上，收入翻了3倍。

以上，既然看到这里了，如果觉得有用，随手点个赞、在看、转发三连吧。

想第一时间收到文章，记得给我个星标⭐️～谢谢你看我的文章，我们，下次见。

本周六线下聚会（闭门会）预告，聚一下子。