谁才是AI大模型真正的先驱者

谁才是AI大模型真正的先驱者？

点击蓝字关注我们

一、余承东的原话：一个需要被审视的“历史叙事”

2026年6月12日，在华为开发者大会（HDC 2026）上，华为常务董事、终端BG董事长余承东发表了以下讲话：

“在全世界都不知道大模型为何物的时候，华为就发布了盘古大模型，可以说是这个行业绝对的全球先驱者。后来因为各种各样的原因，没做好，不应该。去年国庆节前夕，公司又让我来负责这个大模型，我会带领团队一路赶超，从中国第一，走向将来的世界第一。我余承东的字典里，没有第二，只有第一。”

这段话包含三个核心断言：第一，时间断言——“全世界都不知道大模型为何物的时候”，暗示盘古发布时大模型概念尚未存在；第二，地位断言——“绝对的全球先驱者”，将华为定位为行业开创者；第三，因果叙事——“后来因为各种各样的原因，没做好”，将落后归因于外部因素而非技术差距。这些断言是否经得起历史检验？为了厘清谁才是大模型真正的先驱者，我们先审视这番话的发表场合。

已关注

关注

重播分享赞

视频详情

二、他是在什么场合说这番话的？

要理解余承东为什么这样讲，必须先还原他讲话的场合。这不是一场学术研讨会，也不是面向普通消费者的产品发布会，而是华为开发者大会（HDC）——一个具有强烈仪式性质的生态聚合场合。

这个场合台下坐着的有华为内部的技术人员、依赖昇腾生态生存的AI开发者、与华为绑定的系统集成商、受邀报道的科技媒体，以及各级政企客户代表。他们中的绝大多数人对大模型的发展历史有基本认知——他们知道GPT-3在2020年就已发布，知道Transformer架构来自Google，知道2021年4月绝非“全世界都不知道大模型为何物”的蒙昧时期。

然而，正是在这群“知道真相的人”面前，余承东说出了与事实明显相悖的话。这看似矛盾，实则揭示了这种场合的本质：它并非知识交换的论坛，而是生态凝聚的宣誓仪式。在学术会议上，一个与事实不符的论断会立即引发质疑和辩论；但在HDC的场域中，话语权力高度集中，因为台下所有人的商业利益、技术支持和职业网络都与这个生态紧密绑定。在这种场合中，即便有人心存疑虑，内心并不认同这番话，态度上也会选择鼓掌、微笑或至少保持沉默，他们也需要这个故事来开展自己的业务。这与当年邹忌那句“我与城北徐公孰美？”（《战国策·齐策·邹忌讽齐王纳谏》）其实是一样的效果。

三、从国际大模型开发时间线来看，谁才是大模型开发的真正先驱？

要判断谁才是AI大模型的真正先驱，我们需要回到国际大模型发展的真实时间线，去追寻人工智能技术演进的原始脉络。

大模型技术的理论基石是2017年6月Google发布的Transformer架构。这篇名为《Attention Is All You Need》的论文提出了自注意力机制，为后续所有大语言模型提供了最基本的建筑模块。没有Transformer，就没有后来的ChatGPT，更没有盘古。

2018年6月，Google发布BERT，确立了“预训练+微调”的范式，开启了自然语言处理的新纪元。2019年2月，OpenAI发布GPT-2，以15亿参数的规模展示了“规模化”的威力。2020年5月，OpenAI发布GPT-3论文《Language Models are Few-Shot Learners》，以1750亿参数和惊人的few-shot学习能力震惊学界，“涌现能力”概念由此诞生。同年6月，GPT-3 API正式向全世界开放，标志着AI大模型从学术研究走向了商业应用。

至此，AI大模型已成为全球科技界最热门的话题。Google在2021年1月发布Switch Transformer之后不久，2021年3月北京智源研究院启动“悟道1.0”，成为中国首个万亿参数模型；2021年4月，华为发布盘古大模型。

因此，盘古发布时的技术环境绝非AI大模型的“蒙昧时代”。全球AI界不仅“知道”大模型为何物，而且正在围绕它展开激烈的规模化竞赛。2022年4月Google发布5400亿参数的PaLM，2022年11月OpenAI发布ChatGPT引发大众认知爆发，2023年3月GPT-4实现多模态推理——这些后续发展都建立在2020-2021年已形成的大模型范式之上。

因此，真正的先驱者清晰可辨：Google奠定了Transformer架构和BERT范式，OpenAI通过GPT系列定义了“预训练+规模化”的路径并实现了商业化。这些机构的工作为国产大模型提供了全部的技术基础——从架构到方法，从规模化的信念到商业化的示范。盘古在其中扮演的角色，是一个在已有范式基础上进行垂直场景落地的跟进者，而非定义方向的开创者。

四、余承东这样说话背后的逻辑是什么？

余承东的话术并非简单的口误，而是一套精心打造的叙事策略，其背后有三层逻辑。

第一层是认知层面的“时间线偷换”。普通公众对技术的认知有一个“产品触达偏差”——他们知道ChatGPT，因为这是他们第一次直接使用的大模型产品；他们不知道GPT-3，因为它只是面向开发者的API。余承东巧妙地将“大众知道”等同于“行业知道”，将ChatGPT的爆发点偷换为大模型的起源点，从而在公众心智中制造“华为先于世界”的印象。

第二层是民族主义叙事的情感动员。“全世界都不知道...我们就发布了”这一表述将华为塑造为“在西方沉睡时觉醒”的中国科技企业。在美国制裁的背景下，这种叙事将技术竞争升华为国家技术主权的保卫战。任何技术层面的质疑都可能面临巨大的道德风险，可能被解读为“不希望中国领先”或“帮美国说话”。

第三层是个人形象与企业战略的深度绑定。余承东的“大嘴”形象已成为华为消费者业务的标志性符号——从“遥遥领先”到“1000万以内最好的SUV”，再到这次“行业绝对的全球先驱者”。这些夸张表述本身构成了品牌辨识度，受众已经习惯于这样的“余式修辞”。这种预期反而给了他更大的话语自由，因为每一次夸张都在强化“这就是余承东”的认知标签，而非“华为在撒谎”的负面印象。

五、先驱者不是喊出来的

谁是“大模型真正的先驱者”？答案已经不言自明。

真正的先驱者不需要重写历史。Google从未声称“全世界不知道Transformer时我们就发明了它”，OpenAI也从未说“全世界不知道大模型时我们就做了GPT-3”——因为他们知道，技术的演进是累积的、协作的结果。将盘古置于这一真实脉络中，它的位置清晰可见：一个在中国产业纵深中有差异化价值的跟进者。余承东的话术或许能赢得掌声，但改写不了历史。当未来的技术史学者回望2021年，他们会记住GPT-3如何改变了人工智能的轨迹。

先驱者不是喊出来的，是做出来的。

点击此处阅读原文分享点击“转发”