
刘威离开腾讯的时候,混元大模型刚刚发布一年。
这个时间点耐人寻味。2024年底,这位在腾讯工作超过八年、一手主导混元团队的核心人物悄然离职,随即创立了视频重生这家新公司。他的离开,让外界对腾讯AI战略的走向充满了问号。
承认落后,但不认为游戏结束
刘威在接受采访时说了一句颇为直白的话:中国在大语言模型(LLM)这场竞赛中落后了。这个判断,放在当下的行业背景下其实并不意外。OpenAI的GPT-4o、Anthropic的Claude 3.5、谷歌的Gemini Ultra,这些模型在全球基准测试中持续刷新标准,而中国的大模型,包括百度文心、阿里通义、腾讯混元,在综合能力评估上与顶尖美国模型之间的差距仍然存在。
但刘威的观点并没有止步于此。他认为,大语言模型只是人工智能发展进程中的一个"范式",而范式是会更替的。
"范式"这个词在AI研究者圈子里有特定含义,指的是定义某个时代技术创新方向的核心突破。ChatGPT是一个范式,它让全世界意识到生成式AI的商业潜力。Anthropic的Claude Code是另一个范式,它将AI能力从对话拓展到了真实的软件工程任务。
刘威的逻辑是:如果一个新的范式出现,当前的领先优势并不一定能延续。下一个范式在哪里
这个判断是否成立,关键在于"下一个范式"究竟是什么。
目前业界的共识是,纯粹的语言模型能力已经趋于饱和,真正的竞争正在转向"AI Agent",也就是能够自主规划、执行多步骤任务的智能体系统。OpenAI的Operator、谷歌的Project Mariner、微软Copilot的深度集成,都是这个方向的早期探索。
与此同时,多模态能力、具身智能(Embodiment)以及与物理世界的交互,也被越来越多的研究者视为下一波浪潮的核心。马斯克的xAI、英伟达的研究部门、以及大量硅谷初创公司,都在这些方向上密集布局。
中国同样不缺这方面的动作。字节跳动、华为、商汤科技、以及一批从大厂出走的创业者,正在具身智能和垂直场景AI应用上大量投入。刘威创立的视频重生,则聚焦于AI视频生成这一垂直赛道,这本身也是一个正在快速演化的技术领域。
从这个角度看,他选择在垂直应用层创业,而不是继续在基础模型层竞争,多少体现了他对行业格局的判断:在算力和数据积累上已经形成差距的赛道,不如押注下一个可能重新洗牌的方向。
值得注意的是,中国在AI应用层的落地速度和规模,并不弱于美国。根据斯坦福大学发布的2025年AI指数报告,中国在AI相关论文发表数量、专利申请数量以及AI企业融资规模上,仍然位居全球前列。美国在基础模型能力上领先,但中国在制造业AI融合、医疗影像识别、自动驾驶等垂直场景的部署密度,同样不可小觑。
芯片限制是中国AI发展绕不开的变量。美国对华高端芯片出口管制持续收紧,英伟达H100、A100系列对中国市场实际上已近乎断供。华为昇腾系列在加速追赶,但与英伟达在软件生态和绝对算力上的差距,短期内难以弥合。这直接影响了中国大模型训练的规模上限。
刘威在腾讯时期推动混元模型的经历,让他对这一现实有着清醒的认识。大规模预训练需要天量算力,这恰恰是中国目前最受制约的环节。然而,推理侧的算力需求远低于训练侧,而AI应用的商业价值,最终要通过推理来实现。这或许也是为什么越来越多的中国AI从业者,选择在应用层而非模型层寻找突破口。
刘威的判断是否准确,时间会给出答案。但他提出的问题本身,值得认真对待:当一个新的技术范式出现时,先发优势能否延续,从来都不是一道有确定答案的题。过去二十年,移动互联网时代的到来,曾经让PC时代的巨头措手不及;深度学习的兴起,也曾让依赖传统机器学习的团队在短时间内失去优势。AI这场比赛,还远没有到宣布结果的时候。


夜雨聆风