
说实话地,我今天整个人都处于一个麻木的状态。
原因并非在于昨晚我熬夜了,而是在于我观看了 MiniMax 于刚刚地发布了的 M3 模型。
故事是这样地展开的:在早上,我起了床并刷了我的手机,如同惯例一般,首先查看了 X 和数个技术群组。一打开它们,铺天盖地地全部都是关于 MiniMax M3 的推送。我本来的一个以为,是这又属于某一家模型在排行榜上进行刷分,通过制作几个定制的基准测试来实现自我狂欢。然而,当我将我的目光固定地注视过去时,我直接地有一句肮脏的话语被憋在了我的喉咙里面。
重点,它来了。
他们让 M3 执行了一件事情:抛给了它一篇 ICLR 2025 的杰出论文,并命令它自己去进行复现。
请注意,这并非是给予一个提示词,让它去撰写一个摘要;也并非是给予一个 API,让它去翻译成为代码。而是“独立复现”。
在一个时间点里,我甚至觉得这一帮人是疯掉了的。你敢于相信吗?M3 自己,以吭哧吭哧的方式运行了将近 12 个小时。在这 12 个小时的过程里,没有任何人类去触碰键盘,也没有任何人类为它进行屁股的擦拭。它自己地产出了 18 次的提交,地画出了 23 张实验图表,跑通了核心的实验,验证了该篇论文之中的方法论。我,陷入了沉默。
因为我知晓这是何物。这他妈的物件,根本不是一个简单的“模型升级”。这是将一名独立研究员的灵魂,塞进了一台服务器的里面。这是自主迭代的能力,在长程复杂任务的上面进行了一次具象化。在过去的日子里,当我们说起 Agent 的时候,那种感觉就仿佛一个连话语都说不利索的实习生。你必须得盯着它,担心它会将数据库给删除掉。然而,M3 的这个案例,给我看见了另外的一种可能性:它是那种,当你丢给它一个课题,它就能够自己地去啃文献、跑代码、撞击南墙,并且,在最后的时刻,将结论推送到你的电子邮箱里面去的“狠角色”。
更为离谱的事情是——
它是凭借着什么来这样地干的?因为这一个 M3,它是国内第一个将“前沿的编程能力、100 万单位的超长上下文、原生的多模态”这三张鬼牌,同时地攥在了手中的模型。并且,它是当前唯一的开源模型。
你瞧,我原本持有的一种以为,是那 100 万的上下文不过是在堆叠显存。结果是,他们搞出来了一个全新的稀疏注意力架构,被叫作 MSA。这个玩意有着多么地变态?在 100 万上下文的条件下,计算量直接被干到了上一代的 1/20,预填充的阶段加速超过了 9 倍。这就好比如,在过去,当你让人工智能去阅读一本长篇小说,它必须从第一个字认真地读至最后一个字,同时在中间还得做下密密麻麻的笔记,慢得就仿佛要死去了。而现在,MSA 架构让它学会了跳读与略读,眼光一扫过去,就能知道哪里才是关键的情节,效率直接地起飞。
更让我产生破防感受的,是那个多模态。
M3 从步骤 0 开始,就进行了多模态的混合训练。这个意思是什么?它并不是那一类,语言模型先学完毕了,随后再贴上一张图片的“缝合怪”。它是图片、视频,以及文字,从母亲的子宫里面,就是在一块儿被学习的。这就造成了,它不仅仅是能看懂你所发送的梗图,甚至还能去操作你的电脑桌面。在那篇论文的复现之中,M3 就是依仗着原生的多模态能力,硬生生地啃下了论文里面的图表与公式。长上下文保障了论文加上代码加上实验日志,能够一次性进入窗口,编程加上 Agent 的能力则驱动了长线程的执行。
这才是真正的“眼睛”与“大脑”的同步进化。
我翻看过了所有的案例,包括了那些宣称 M3 在 SWE-Bench Pro 的上面超越了 GPT-5.5 与 Gemini 3.1 Pro,并且直逼 Opus 4.7 的跑分数据。但是,说实话地,那个“12 小时独立复现论文”的画面,那个没有人类进行干预、全力地狂奔的夜晚,交予我的冲击,比任何跑分都更要大。
本质之上,这是“自主权”在机器与人类之间的一个重新分配。
在过去的数个月份里,大模型的市场杀得是昏天黑地。从“价格屠夫”到“股价遭受腰斩”,再到“每周的更迭”,我们曾经持有的以为,是我们讨论的是技术的参数,是性价比,是订阅的方案。但是,我们实际上正在讨论的是:人类,还要不要去做那些冗长的、机械的,而且需要被硬啃下来的“中间过程”?
在宏大的叙事与冰冷的跑分背后,我想起了从前带领实习生的那些时日。我手把手地去教他配置环境,修改程序错误,经常地被气到想要砸掉电脑。但是此时此刻,望着 M3 的提交记录,我忽然地感受到了一阵恍惚。我们所谓的“懂”与“会”,在许多的时候,不过是把时间花费在踩上了足够多的坑这样一件事上罢了。
因此,这件事情的核心,并不是算力的碾压,而是时间的复利。
我们曾经以为,我们所追逐的,是更加便宜的 Token。其实,我们所追逐的,是那些被压缩了的时间,以及被重新进行了定义的尊严。
这也正好地应验了那一句被给出的提醒:“优秀的顺序,比优秀本身更要来得重要。”
而关于我们的故事,很有可能,是才刚刚地开始了。
以上,如果觉得不错的话,请去点击一个赞/在看/转发三连;想要在第一时间收到推送的话,请记得进行星标。我们,在下次的时候再见。
夜雨聆风