
8日晚,月之暗面 Kimi 公众号发表文章:“Kimi 将公开预测 104 场世界杯赛事:德国队或爆冷夺冠”。
看到这个消息时,我脑子里冒出来的第一个念头不是"AI又来卷世界杯了",是"这不就是章鱼保罗的赛博升级版吗?"
2010年南非世界杯,一只德国章鱼趴在西班牙国旗上啃贻贝,8次预测全中,成了世界杯历史上最传奇的"预言家"。16年后,2026年美加墨世界杯揭幕在即,Kimi宣布要用300个AI子Agent同时跑预测,覆盖全部104场比赛。
从一只章鱼到300个AI大脑,人类预测世界杯的方式,确实是迈了一大步。

但你仔细品品,这事有意思的地方不在"AI又来预测了",而在Kimi这次怎么干的。
第一,不是问一个AI"谁赢",是拉了300个AI一起开会。每个子Agent分工明确:有的盯Elo和FIFA排名,有的算xG和xT进攻效率,有的分析高位压迫对低位防守的战术克制关系,有的跟踪伤病名单、旅行距离、天气条件,还有的专门盯赔率变化,看市场情绪往哪飘。
每个AI得交一份作业:给出结论、附上证据和置信度,还得写反方解释——为什么自己也可能错。最后不是简单多数投票,而是经过融合、校验、风险标注,以概率的方式呈现。
这不像算命,更像是300个分析师同时做了300份研究报告,然后交给一个人汇总。你如果开过会就知道,让30个人达成一致都难,300个AI一起干活还能不乱,这件事本身的技术难度,可能比预测比分更大。
第二,Kimi承认自己会错,而且给了具体数字。
高置信度预测准确率85%-90%,中等置信度55%-65%,低置信度接近随机。这不是谦虚,是把"不确定性"这个AI预测里最忌讳的词,正面摆上了台面。你想想过去那些"AI预测世界杯"的新闻标题——“AI神准预测XX队夺冠”——哪个会告诉你自己可能错?Kimi这次的公开姿态,跟那些标题党之间的差距,大概就是天气预报和星座运势之间的差距。
第三,也是最值得聊的,Kimi发现了一个"偏差"。
当前主流模型几乎一致看好西班牙和法国夺冠,Opta超级计算机给西班牙算出了17%的夺冠概率,遥遥领先。Kimi的框架大体同意这两家排前二,但在分析过程中,模型发现德国队的夺冠概率可能被市场低估了。
注意Kimi的措辞:这不是一个"德国队将夺冠"的确定性判断,而是"模型识别到了一个可能存在的概率偏差,值得公开记录和后续验证"。翻译成大白话就是:AI觉得你们可能都小看德国队了,但它自己也不确定对,先把话放在这儿,等比赛打完再复盘。
说句实在话,这个态度比"预测德国夺冠"要诚实得多,也高级得多。
德国队在纳格尔斯曼手下确实换了一副面孔,穆夏拉领衔的新生代、德甲联赛输出的战术纪律、外加德国队在大赛里祖传的"被低估后爆发"剧本——这些因素在赔率里可能真的没被充分定价。
当然,也可能Kimi想多了,德国队踢了两场就回家。但"提出一个值得验证的问题"这件事本身,就比"给出一个确定答案"更有价值。

回到那个更大的问题:AI能预测世界杯吗?
其实谁也没底,足球不是国际象棋,11个人在草坪上跑90分钟,一个VAR判罚、一脚折射、一个门将脱手,就能让300个AI白算三天。
章鱼保罗8场全中,靠的是概率撞上了运气。Kimi的300个AI,最终也逃不掉这个基本事实——足球的魅力,在于不可预测。
但Kimi这次做的事情,目标可能本来就不是"猜对比分"。
它公开跑104场预测,赛前报概率、赛后做复盘,错就认,偏差就标记,一整届比赛下来,等于用一场全球关注的赛事,做了一套完整的AI推理能力压力测试。这个过程的展示价值,可能比预测正确率本身更有分量。
一个拉300个AI、公开复盘每一场对错的系统,你未来看好它吗?还是更怀念那只德国章鱼?
夜雨聆风