6月12日,东莞松山湖。
余承东站在华为开发者大会的舞台上,说了一句话
"HarmonyOS 7,是首个完成AI化改造的操作系统。"
这句话的分量,很多人还没反应过来。
过去十年,我们对AI的理解是:它是一个APP。你打开ChatGPT,问问题;你打开Midjourney,画图;你打开Copilot,写代码。AI永远是"那个你打开的东西"。
但鸿蒙7做了一件截然不同的事:它把大模型塞进了操作系统内核。
盘古大模型6.0,直接嵌入系统底层。AI不再是"打开"的,而是"活在"系统里的。你的手机,第一次真正"长了脑子"。
而这,只是这周AI圈三件大事的其中一件。
同一天,智源研究院发布"悟界"系列大模型,宣告AI从"预测下一个Token"走向"预测下一个物理状态";MiniMax M3开源模型首周冲进全球调用量前三,中国大模型周调用量连续六周超过美国。
三条线索,指向同一个方向——AI正在从"对话"走向"行动",从"工具"变成"环境"。
今天,我们深度拆解。
一、鸿蒙7:AI不再是"功能",它是"底座"
1.1 从"万物互联"到"Agent时代"
HarmonyOS 6的时代,鸿蒙讲的故事是"万物互联"——手机、手表、电视、汽车,碰一碰就通。
HarmonyOS 7的故事变了。四个字:Agent时代。
什么叫Agent时代?简单说,以前你告诉手机"我想去爬山",手机给你弹出一堆搜索结果。现在你告诉小艺"我想去爬山",它会:
🗺️ 推荐路线(联动地图服务)
🎒 推荐装备(联动电商服务)
🌤️ 查天气(联动气象服务)
👥 找同伴(联动社交服务)
一个意图,一整套服务,全链路自动编排。
这背后是鸿蒙7的Agent架构三大支柱:
| 复杂任务成功率>90% | ||
| 1.8亿日活,日均唤醒30亿次 |
1.2 盘古6.0内嵌:AI任务本地运行
这是最值得关注的技术突破。
盘古大模型6.0直接嵌入系统内核,AI任务可以本地运行,不依赖云端。
这意味着什么?
隐私:你的对话、照片、日程分析,全在设备端完成,不上传云端
速度:无需网络往返,响应毫秒级
离线可用:飞机上、地铁里,AI能力不中断
成本:不消耗云端推理资源,华为的算力账本更好看
目前没有任何其他操作系统做到这一点。苹果的Siri AI还要到"今年晚些时候"才上线,而且在中国大陆尚不可用。
1.3 性能数据:不是PPT,是实测
余承东这次给的数据很硬核:
应用跳转速度提升25%
打卡速度提升22%
重点应用保活率提升34%
多图加载速度提升100%
系统应用流畅度提升24%
生态应用流畅度提升34%
整体性能比HarmonyOS 6提升15%,年度系统负载增长控制在≤10%(优于行业平均)。
这些提升的底层逻辑是:方舟引擎首次集成性能大模型。
AI不仅在"服务"层面工作,它直接参与系统资源调度
哪个应用该优先、哪个进程该保活、内存怎么分配,AI说了算。
1.4 首发与适配
首发机型:Mate90系列,2026年秋季,搭载基于τ定律的麒麟2026芯片
开发者Beta:即日开放,首批支持Mate80 Pro、Pura90 Pro Max、nova15 Pro等6款设备
终端规模:HarmonyOS 6终端设备数已突破6600万
二、openPangu 2.0开源:华为把"核武器"交给了开发者
2.1 505B参数,但不是堆参数
余承东这次发布的openPangu 2.0,参数规模最高505B(Pro版本),另有92B的Flash版本。但华为不追参数——余承东亲口解释:
"华为算力大量支持了国内其他企业的需求,自身预留的算力非常有限。AI算力成本较高,华为选择优先优化模型实际运行效率,而非追求更大的参数规模。"
所以openPangu 2.0的核心指标不是"最大",而是"最省":
更关键的是:更亲和昇腾算力,更适配鸿蒙系统,Agent任务更快更准更省。 这不是通用模型,这是为鸿蒙生态量身定制的"原住民"模型。
2.2 七大组件,6月30日起开源
openPangu 2.0计划开源7大组件,包括:
预训练代码
后训练代码
训练算子
(其余4项待公布)
开源时间:2026年6月30日起陆续发布。
这意味着什么?开发者不只是拿到一个推理权重,而是拿到从训练到部署的全链路工具。你可以基于openPangu 2.0:
用昇腾卡做预训练
用鸿蒙智能体框架2.0做Agent开发
用FlagOS做多芯片部署
从芯片到操作系统到模型到框架,华为给了一条完整的国产AI全栈路径。
2.3 余承东的野心:"只做第一"
余承东在发布会上放出豪言:
"自己的字典没有第二,只有第一。"
他回顾了华为发布大模型的历史——"全中国、全世界还不知道大模型为何物的时候,华为就已经发布了盘古大模型"。
从2021年盘古1.0到2026年openPangu 2.0,5年时间,华为从"第一个发布大模型"到"第一个把大模型嵌入操作系统",这条路线的执着程度,值得尊重。
三、智源"悟界":从"预测下一个Token"到"预测下一个物理状态"
3.1 一场范式变革
6月12日,同一天,北京中关村,第八届智源大会开幕。
智源研究院院长王仲远提出了一个划时代的论断:
人工智能正在从"预测下一个Token"迈向"预测下一个物理状态"。
这不是措辞游戏。这是AI发展路线的根本转向:
旧范式:大语言模型预测下一个Token(文字→文字),能力边界在数字世界
新范式:世界模型预测下一个物理状态(感知→行动),能力边界延伸到物理世界
智源理事长黄铁军在闭幕演讲中把这个逻辑讲透了:
"企业用成熟的VLA/VLM解决特定场景的问题,是可行的商业化路径。但研究机构必须追求通用化的具身智能,让机器人像人类一样在任意场景解决问题,因此必须研发世界模型。"
3.2 五个子模型,五条技术路线
"悟界"不是一个模型,而是一个模型家族:
| 全球首个 | ||
它的核心创新是:不以像素预测为目标,而是以物理隐空间表征为目标。 简单说,它不是"画"出下一帧画面,而是"理解"下一个物理状态会怎样。
支持50+复杂物理场景的长程推理,具备物理一致性、动作因果性等四大核心能力。
3.3 FlagOS 2.1:破解"多模型×多芯片"困局
智源牵头打造的FlagOS升级到2.1版本,解决了国产AI最痛的问题之一:
支持18家芯片厂商的32款芯片
算子总数超600个
支持90%以上主流开源大模型的多芯片部署
大模型发布即多芯适配
还迈出了"量智融合"的第一步——量子计算+AI推理的融合探索。
四、中国大模型调用量首超美国:不是偶然,是结构性的
4.1 MiniMax M3:一个里程碑
MiniMax发布的M3模型,国内首个集齐"原生多模态+百万级超长上下文+前沿编程能力"三大核心能力的开源大模型。
核心数据:
上下文窗口:100万token
推理效率:单token计算量仅为上一代的1/20
架构:自研MSA稀疏注意力架构
首周表现:冲进全球大模型调用量前三
4.2 连续六周超越
更关键的数据在这里:
中国大模型周调用量已连续六周超过美国。6月1日-7日周调用量达14.19万亿token,全球前五大调用模型中中国占据四席。
这不是某个模型的胜利,是整个中国AI生态的胜利。原因有三:
① 开源生态爆发。 GLM-5.2 MIT协议开源、openPangu 2.0开源、M3开源——中国顶级大模型集体开源,开发者调用门槛降到零。
② 应用场景丰富。 14亿人口的市场,微信、淘宝、抖音、美团……每个超级APP都是大模型的调用入口。智能体互联国标(GB/Z 185-2026)发布后,400万小程序变Agent服务节点,调用量指数级增长。
③ 算力基础设施成熟。 昇腾、寒武纪、海光……18家芯片厂商32款芯片,FlagOS让模型"发布即适配",算力不再是瓶颈。
五、行业洞察:三条线索,一个方向
把本周三件大事拉远看,你会发现一个清晰的图景:
线索1:AI从"APP"变成"OS"
鸿蒙7把大模型嵌入系统内核,苹果把Siri升级为独立AI应用,ChatGPT从聊天机器人变成"超级应用"——所有人都在做同一件事:把AI从"你打开的东西"变成"你活在里面的环境"。
这意味着AI的竞争维度变了。以前比的是谁的模型更聪明,现在比的是谁的AI更深地嵌入用户的生活。
线索2:从"预测Token"到"预测物理状态"
智源悟界、华为盘古6.0端侧运行、英伟达RTX Spark端侧1PFLOPS算力——AI正在从数字世界走向物理世界。
这不是概念,是工程。盘古6.0已经在你手机里了,RTX Spark今年秋天就上市了,悟界Physis-v0.1已经能做50+物理场景推理了。
线索3:中国AI从"追赶"到"并跑"
中国大模型调用量连续六周超美国,这不是脉冲式的,是结构性的。开源生态+应用场景+算力基建,三个引擎同时运转。
但也要清醒:调用量≠技术领先。中国模型在基础能力上与国际顶尖仍有差距,MiniMax M3首周进前三,但OpenAI、Anthropic的产品化深度远超中国同行。
"并跑"已经是巨大进步,但离"领跑"还有距离。
六、对普通人的影响:你现在应该做什么?
如果你是开发者
🛠️ openPangu 2.0 6月30日开源,7大组件全链路开放。用昇腾卡训练+鸿蒙框架部署Agent,这是华为生态的开发者红利窗口。
🤖 鸿蒙智能体框架2.0复杂任务成功率>90%,20+AI能力开放。做鸿蒙Agent应用,比做微信小程序更有先发优势。
🔬 悟界系列模型面向学术和科研场景开放,如果你做具身智能、机器人、药物发现,这是国内最好的基座模型。
如果你不是开发者
📱 等Mate90系列——首发搭载鸿蒙7+麒麟2026芯片,AI能力直接拉满
💡 关注"中国AI调用量超美国"这件事——这意味着国产AI应用会越来越便宜、越来越好用,你的AI使用成本会持续下降
🎯 学会用Agent而不是聊天——AI的未来不是"问问题",是"给任务"。学会拆解你的工作流程,把每个环节交给AI执行
写在最后
这周最让我震撼的不是某个具体的产品发布,而是一个趋势正在加速:
AI正在从"你打开的APP"变成"你活在里面的环境"。
鸿蒙7把大模型塞进操作系统内核,智源在研究让AI理解物理世界,MiniMax让中国大模型调用量超过美国——这三件事,看似各自为战,实则在同一张地图上前进。
十年后回头看,2026年6月可能是一个分水岭:AI从"对话框里的工具"变成了"无处不在的基础设施"。
就像电一样——你不会"打开"电,你只是活在有电的世界里。
AI,正在变成那个"你不会打开,但始终在场"的东西。
💬 你怎么看鸿蒙7把AI嵌入操作系统?你觉得AI是应该当工具还是当环境?欢迎在评论区聊聊!
如果觉得这篇有收获,点个赞👍,转发给你的朋友,让更多人看到AI正在发生的根本性变化。
关注「Ta说我听」,每天带你看懂AI最前沿。
夜雨聆风