0.5GB。你在手机上下载一个高清短视频,可能都比它大。所以你知道这是什么概念吗。这个在 AA 榜单上干翻了所有 2B 以下模型的家伙,可以跑在你手边的几乎任何设备上。手机、电脑、浏览器,甚至是那种连独立显卡都没有的老旧笔记本。面壁智能还开源了一个自研的 CPU 推理框架叫 ArcLight,专门为纯 CPU 环境做的深度优化。你没有 GPU,没关系。你连本地环境都不想配,也可以直接在浏览器里打开,零安装,零配置。这是一种很奇怪的体感。一个全球最强的 1B 模型,就这么安安静静地躺在你的设备里。不需要机房,不需要 GPU 集群,不需要每个月几百块的 API 费用。你打开浏览器,它就在那里。说到这儿,有一个特别有意思的东西。面壁智能拿 MiniCPM5-1B 做了一个「桌宠」。你养过桌面宠物吗?那种在电脑屏幕上走来走去的小东西,点一点它会跟你互动。但这次的桌宠不一样,它后面站着一个真实的、能力很强的 1B 大模型。它会跟你聊天,会记住你说过的话,会在你不知道干什么的时候冒出来给你一点陪伴感。
没有网也能跑
你想想这个场景。你在深夜加班,四周安静得让人发慌,打开电脑,桌面上那个小东西醒了。它不是云端某个机房里的 AI 给你回复,它就在你眼前的这台机器里,跟你共享同一块 CPU。这种「AI 在身边」的体验,跟「AI 在云端」是两种完全不同的东西。好,模型的部分聊完了。现在聊那件真正让我起鸡皮疙瘩的事。MiniCPM5-1B 的 Base Model 版本,也就是它的基座模型,是由面壁智能的 AI 训练框架 ForgeTrain 预训练完成的。ForgeTrain 是什么。
它是全球第一个完全由 AI 编写的生产级大模型预训练框架
全部代码由 AI 生成,人类工程师零代码介入一。行。都。没。写。我寻思了一下我没寻思明白。一个训练框架,几千几万行代码,涉及分布式计算、内存管理、通信优化、算子融合、并行策略,这些随便拉一块出来都够一个 PhD 干半年的东西,全由 AI 写了。而且不是写着玩的。这套框架在英伟达 H100 上跑出来的训练速度,比英伟达自家的 Megatron 快了 10%。