谁才是AI大模型真正的先驱者?

点击蓝字 关注我们

+
一、余承东的原话:一个需要被审视的“历史叙事”
2026年6月12日,在华为开发者大会(HDC 2026)上,华为常务董事、终端BG董事长余承东发表了以下讲话:
“在全世界都不知道大模型为何物的时候,华为就发布了盘古大模型,可以说是这个行业绝对的全球先驱者。后来因为各种各样的原因,没做好,不应该。去年国庆节前夕,公司又让我来负责这个大模型,我会带领团队一路赶超,从中国第一,走向将来的世界第一。我余承东的字典里,没有第二,只有第一。”
这段话包含三个核心断言:第一,时间断言——“全世界都不知道大模型为何物的时候”,暗示盘古发布时大模型概念尚未存在;第二,地位断言——“绝对的全球先驱者”,将华为定位为行业开创者;第三,因果叙事——“后来因为各种各样的原因,没做好”,将落后归因于外部因素而非技术差距。这些断言是否经得起历史检验?为了厘清谁才是大模型真正的先驱者,我们先审视这番话的发表场合。
+
二、他是在什么场合说这番话的?
要理解余承东为什么这样讲,必须先还原他讲话的场合。这不是一场学术研讨会,也不是面向普通消费者的产品发布会,而是华为开发者大会(HDC)——一个具有强烈仪式性质的生态聚合场合。
这个场合台下坐着的有华为内部的技术人员、依赖昇腾生态生存的AI开发者、与华为绑定的系统集成商、受邀报道的科技媒体,以及各级政企客户代表。他们中的绝大多数人对大模型的发展历史有基本认知——他们知道GPT-3在2020年就已发布,知道Transformer架构来自Google,知道2021年4月绝非“全世界都不知道大模型为何物”的蒙昧时期。
然而,正是在这群“知道真相的人”面前,余承东说出了与事实明显相悖的话。这看似矛盾,实则揭示了这种场合的本质:它并非知识交换的论坛,而是生态凝聚的宣誓仪式。在学术会议上,一个与事实不符的论断会立即引发质疑和辩论;但在HDC的场域中,话语权力高度集中,因为台下所有人的商业利益、技术支持和职业网络都与这个生态紧密绑定。在这种场合中,即便有人心存疑虑,内心并不认同这番话,态度上也会选择鼓掌、微笑或至少保持沉默,他们也需要这个故事来开展自己的业务。这与当年邹忌那句“我与城北徐公孰美?”(《战国策·齐策·邹忌讽齐王纳谏》)其实是一样的效果。
+
三、从国际大模型开发时间线来看,谁才是大模型开发的真正先驱?
要判断谁才是AI大模型的真正先驱,我们需要回到国际大模型发展的真实时间线,去追寻人工智能技术演进的原始脉络。
大模型技术的理论基石是2017年6月Google发布的Transformer架构。这篇名为《Attention Is All You Need》的论文提出了自注意力机制,为后续所有大语言模型提供了最基本的建筑模块。没有Transformer,就没有后来的ChatGPT,更没有盘古。
2018年6月,Google发布BERT,确立了“预训练+微调”的范式,开启了自然语言处理的新纪元。2019年2月,OpenAI发布GPT-2,以15亿参数的规模展示了“规模化”的威力。2020年5月,OpenAI发布GPT-3论文《Language Models are Few-Shot Learners》,以1750亿参数和惊人的few-shot学习能力震惊学界,“涌现能力”概念由此诞生。同年6月,GPT-3 API正式向全世界开放,标志着AI大模型从学术研究走向了商业应用。
至此,AI大模型已成为全球科技界最热门的话题。Google在2021年1月发布Switch Transformer之后不久,2021年3月北京智源研究院启动“悟道1.0”,成为中国首个万亿参数模型;2021年4月,华为发布盘古大模型。
因此,盘古发布时的技术环境绝非AI大模型的“蒙昧时代”。全球AI界不仅“知道”大模型为何物,而且正在围绕它展开激烈的规模化竞赛。2022年4月Google发布5400亿参数的PaLM,2022年11月OpenAI发布ChatGPT引发大众认知爆发,2023年3月GPT-4实现多模态推理——这些后续发展都建立在2020-2021年已形成的大模型范式之上。
因此,真正的先驱者清晰可辨:Google奠定了Transformer架构和BERT范式,OpenAI通过GPT系列定义了“预训练+规模化”的路径并实现了商业化。这些机构的工作为国产大模型提供了全部的技术基础——从架构到方法,从规模化的信念到商业化的示范。盘古在其中扮演的角色,是一个在已有范式基础上进行垂直场景落地的跟进者,而非定义方向的开创者。
+
四、余承东这样说话背后的逻辑是什么?
余承东的话术并非简单的口误,而是一套精心打造的叙事策略,其背后有三层逻辑。
第一层是认知层面的“时间线偷换”。普通公众对技术的认知有一个“产品触达偏差”——他们知道ChatGPT,因为这是他们第一次直接使用的大模型产品;他们不知道GPT-3,因为它只是面向开发者的API。余承东巧妙地将“大众知道”等同于“行业知道”,将ChatGPT的爆发点偷换为大模型的起源点,从而在公众心智中制造“华为先于世界”的印象。
第二层是民族主义叙事的情感动员。“全世界都不知道...我们就发布了”这一表述将华为塑造为“在西方沉睡时觉醒”的中国科技企业。在美国制裁的背景下,这种叙事将技术竞争升华为国家技术主权的保卫战。任何技术层面的质疑都可能面临巨大的道德风险,可能被解读为“不希望中国领先”或“帮美国说话”。
第三层是个人形象与企业战略的深度绑定。余承东的“大嘴”形象已成为华为消费者业务的标志性符号——从“遥遥领先”到“1000万以内最好的SUV”,再到这次“行业绝对的全球先驱者”。这些夸张表述本身构成了品牌辨识度,受众已经习惯于这样的“余式修辞”。这种预期反而给了他更大的话语自由,因为每一次夸张都在强化“这就是余承东”的认知标签,而非“华为在撒谎”的负面印象。
+
五、先驱者不是喊出来的
谁是“大模型真正的先驱者”?答案已经不言自明。
真正的先驱者不需要重写历史。Google从未声称“全世界不知道Transformer时我们就发明了它”,OpenAI也从未说“全世界不知道大模型时我们就做了GPT-3”——因为他们知道,技术的演进是累积的、协作的结果。将盘古置于这一真实脉络中,它的位置清晰可见:一个在中国产业纵深中有差异化价值的跟进者。余承东的话术或许能赢得掌声,但改写不了历史。当未来的技术史学者回望2021年,他们会记住GPT-3如何改变了人工智能的轨迹。
先驱者不是喊出来的,是做出来的。

点击此处阅读原文分享点击“转发”

夜雨聆风