AI不再是APP,它成了操作系统:鸿蒙7让6600万设备长脑子,盘古2.0开源505B参数

6月12日，东莞松山湖。

余承东站在华为开发者大会的舞台上，说了一句话

"HarmonyOS 7，是首个完成AI化改造的操作系统。"

这句话的分量，很多人还没反应过来。

过去十年，我们对AI的理解是：它是一个APP。你打开ChatGPT，问问题；你打开Midjourney，画图；你打开Copilot，写代码。AI永远是"那个你打开的东西"。

但鸿蒙7做了一件截然不同的事：它把大模型塞进了操作系统内核。

盘古大模型6.0，直接嵌入系统底层。AI不再是"打开"的，而是"活在"系统里的。你的手机，第一次真正"长了脑子"。

而这，只是这周AI圈三件大事的其中一件。

同一天，智源研究院发布"悟界"系列大模型，宣告AI从"预测下一个Token"走向"预测下一个物理状态"；MiniMax M3开源模型首周冲进全球调用量前三，中国大模型周调用量连续六周超过美国。

三条线索，指向同一个方向——AI正在从"对话"走向"行动"，从"工具"变成"环境"。

今天，我们深度拆解。

一、鸿蒙7：AI不再是"功能"，它是"底座"

1.1 从"万物互联"到"Agent时代"

HarmonyOS 6的时代，鸿蒙讲的故事是"万物互联"——手机、手表、电视、汽车，碰一碰就通。

HarmonyOS 7的故事变了。四个字：Agent时代。

什么叫Agent时代？简单说，以前你告诉手机"我想去爬山"，手机给你弹出一堆搜索结果。现在你告诉小艺"我想去爬山"，它会：

🗺️ 推荐路线（联动地图服务）

🎒 推荐装备（联动电商服务）

🌤️ 查天气（联动气象服务）

👥 找同伴（联动社交服务）

一个意图，一整套服务，全链路自动编排。

这背后是鸿蒙7的Agent架构三大支柱：

组件	核心能力	关键数据
Agent亲和系统架构	系统底层适配Agent运行逻辑	主动协作完成用户需求
鸿蒙智能体框架2.0	"意图即服务"	复杂任务成功率>90%
系统智能体小艺	场景主动推荐	1.8亿日活，日均唤醒30亿次

日均唤醒30亿次。 这个数字意味着，小艺已经不是"偶尔用用"的语音助手了，它是每天被调用3000次的操作系统级入口。

1.2 盘古6.0内嵌：AI任务本地运行

这是最值得关注的技术突破。

盘古大模型6.0直接嵌入系统内核，AI任务可以本地运行，不依赖云端。

这意味着什么？

隐私：你的对话、照片、日程分析，全在设备端完成，不上传云端

速度：无需网络往返，响应毫秒级

离线可用：飞机上、地铁里，AI能力不中断

成本：不消耗云端推理资源，华为的算力账本更好看

目前没有任何其他操作系统做到这一点。苹果的Siri AI还要到"今年晚些时候"才上线，而且在中国大陆尚不可用。

1.3 性能数据：不是PPT，是实测

余承东这次给的数据很硬核：

应用跳转速度提升25%

打卡速度提升22%

重点应用保活率提升34%

多图加载速度提升100%

系统应用流畅度提升24%

生态应用流畅度提升34%

整体性能比HarmonyOS 6提升15%，年度系统负载增长控制在≤10%（优于行业平均）。

这些提升的底层逻辑是：方舟引擎首次集成性能大模型。

AI不仅在"服务"层面工作，它直接参与系统资源调度

哪个应用该优先、哪个进程该保活、内存怎么分配，AI说了算。

1.4 首发与适配

首发机型：Mate90系列，2026年秋季，搭载基于τ定律的麒麟2026芯片

开发者Beta：即日开放，首批支持Mate80 Pro、Pura90 Pro Max、nova15 Pro等6款设备

终端规模：HarmonyOS 6终端设备数已突破6600万

二、openPangu 2.0开源：华为把"核武器"交给了开发者

2.1 505B参数，但不是堆参数

余承东这次发布的openPangu 2.0，参数规模最高505B（Pro版本），另有92B的Flash版本。但华为不追参数——余承东亲口解释：

"华为算力大量支持了国内其他企业的需求，自身预留的算力非常有限。AI算力成本较高，华为选择优先优化模型实际运行效率，而非追求更大的参数规模。"

所以openPangu 2.0的核心指标不是"最大"，而是"最省"：

版本	总参数	激活参数	上下文	核心优势
Pro	505B	18B	512K	单卡吞吐率业界2倍
Flash	92B	6B	512K	轻量高效，适配鸿蒙Agent

505B总参数但只激活18B——这是MoE（混合专家）架构的典型做法。模型"知道得多"，但每次推理只调用最相关的部分，既保证效果又节省算力。

更关键的是：更亲和昇腾算力，更适配鸿蒙系统，Agent任务更快更准更省。 这不是通用模型，这是为鸿蒙生态量身定制的"原住民"模型。

2.2 七大组件，6月30日起开源

openPangu 2.0计划开源7大组件，包括：

预训练代码

后训练代码

训练算子

（其余4项待公布）

开源时间：2026年6月30日起陆续发布。

这意味着什么？开发者不只是拿到一个推理权重，而是拿到从训练到部署的全链路工具。你可以基于openPangu 2.0：

用昇腾卡做预训练

用鸿蒙智能体框架2.0做Agent开发

用FlagOS做多芯片部署

从芯片到操作系统到模型到框架，华为给了一条完整的国产AI全栈路径。

2.3 余承东的野心："只做第一"

余承东在发布会上放出豪言：

"自己的字典没有第二，只有第一。"

他回顾了华为发布大模型的历史——"全中国、全世界还不知道大模型为何物的时候，华为就已经发布了盘古大模型"。

从2021年盘古1.0到2026年openPangu 2.0，5年时间，华为从"第一个发布大模型"到"第一个把大模型嵌入操作系统"，这条路线的执着程度，值得尊重。

三、智源"悟界"：从"预测下一个Token"到"预测下一个物理状态"

3.1 一场范式变革

6月12日，同一天，北京中关村，第八届智源大会开幕。

智源研究院院长王仲远提出了一个划时代的论断：

人工智能正在从"预测下一个Token"迈向"预测下一个物理状态"。

这不是措辞游戏。这是AI发展路线的根本转向：

旧范式：大语言模型预测下一个Token（文字→文字），能力边界在数字世界

新范式：世界模型预测下一个物理状态（感知→行动），能力边界延伸到物理世界

智源理事长黄铁军在闭幕演讲中把这个逻辑讲透了：

"企业用成熟的VLA/VLM解决特定场景的问题，是可行的商业化路径。但研究机构必须追求通用化的具身智能，让机器人像人类一样在任意场景解决问题，因此必须研发世界模型。"

3.2 五个子模型，五条技术路线

"悟界"不是一个模型，而是一个模型家族：

模型	定位	核心突破
Emu3.5	多模态统一	文本+图像+视频统一学习，登刊Nature
Brainμ1.0	神经科学	全球首个脑信号多模态大模型，登刊Science
OpenComplex2.5	药物发现	单模型覆盖制药四大步骤
Physis-v0.1	通用世界基座	全球首个通用世界基座模型，物理隐空间表征
RoboBrain Orca	具身大脑	"想、看、动"三位一体

其中最值得关注的是Physis-v0.1——全球首个通用世界基座模型。

它的核心创新是：不以像素预测为目标，而是以物理隐空间表征为目标。 简单说，它不是"画"出下一帧画面，而是"理解"下一个物理状态会怎样。

支持50+复杂物理场景的长程推理，具备物理一致性、动作因果性等四大核心能力。

3.3 FlagOS 2.1：破解"多模型×多芯片"困局

智源牵头打造的FlagOS升级到2.1版本，解决了国产AI最痛的问题之一：

支持18家芯片厂商的32款芯片

算子总数超600个

支持90%以上主流开源大模型的多芯片部署

大模型发布即多芯适配

还迈出了"量智融合"的第一步——量子计算+AI推理的融合探索。

四、中国大模型调用量首超美国：不是偶然，是结构性的

4.1 MiniMax M3：一个里程碑

MiniMax发布的M3模型，国内首个集齐"原生多模态+百万级超长上下文+前沿编程能力"三大核心能力的开源大模型。

核心数据：

上下文窗口：100万token

推理效率：单token计算量仅为上一代的1/20

架构：自研MSA稀疏注意力架构

首周表现：冲进全球大模型调用量前三

4.2 连续六周超越

更关键的数据在这里：

中国大模型周调用量已连续六周超过美国。6月1日-7日周调用量达14.19万亿token，全球前五大调用模型中中国占据四席。

这不是某个模型的胜利，是整个中国AI生态的胜利。原因有三：

① 开源生态爆发。 GLM-5.2 MIT协议开源、openPangu 2.0开源、M3开源——中国顶级大模型集体开源，开发者调用门槛降到零。

② 应用场景丰富。 14亿人口的市场，微信、淘宝、抖音、美团……每个超级APP都是大模型的调用入口。智能体互联国标（GB/Z 185-2026）发布后，400万小程序变Agent服务节点，调用量指数级增长。

③ 算力基础设施成熟。 昇腾、寒武纪、海光……18家芯片厂商32款芯片，FlagOS让模型"发布即适配"，算力不再是瓶颈。

五、行业洞察：三条线索，一个方向

把本周三件大事拉远看，你会发现一个清晰的图景：

线索1：AI从"APP"变成"OS"

鸿蒙7把大模型嵌入系统内核，苹果把Siri升级为独立AI应用，ChatGPT从聊天机器人变成"超级应用"——所有人都在做同一件事：把AI从"你打开的东西"变成"你活在里面的环境"。

这意味着AI的竞争维度变了。以前比的是谁的模型更聪明，现在比的是谁的AI更深地嵌入用户的生活。

线索2：从"预测Token"到"预测物理状态"

智源悟界、华为盘古6.0端侧运行、英伟达RTX Spark端侧1PFLOPS算力——AI正在从数字世界走向物理世界。

这不是概念，是工程。盘古6.0已经在你手机里了，RTX Spark今年秋天就上市了，悟界Physis-v0.1已经能做50+物理场景推理了。

线索3：中国AI从"追赶"到"并跑"

中国大模型调用量连续六周超美国，这不是脉冲式的，是结构性的。开源生态+应用场景+算力基建，三个引擎同时运转。

但也要清醒：调用量≠技术领先。中国模型在基础能力上与国际顶尖仍有差距，MiniMax M3首周进前三，但OpenAI、Anthropic的产品化深度远超中国同行。

"并跑"已经是巨大进步，但离"领跑"还有距离。

六、对普通人的影响：你现在应该做什么？

如果你是开发者

🛠️ openPangu 2.0 6月30日开源，7大组件全链路开放。用昇腾卡训练+鸿蒙框架部署Agent，这是华为生态的开发者红利窗口。

🤖 鸿蒙智能体框架2.0复杂任务成功率>90%，20+AI能力开放。做鸿蒙Agent应用，比做微信小程序更有先发优势。

🔬 悟界系列模型面向学术和科研场景开放，如果你做具身智能、机器人、药物发现，这是国内最好的基座模型。

如果你不是开发者

📱 等Mate90系列——首发搭载鸿蒙7+麒麟2026芯片，AI能力直接拉满

💡 关注"中国AI调用量超美国"这件事——这意味着国产AI应用会越来越便宜、越来越好用，你的AI使用成本会持续下降

🎯 学会用Agent而不是聊天——AI的未来不是"问问题"，是"给任务"。学会拆解你的工作流程，把每个环节交给AI执行

写在最后

这周最让我震撼的不是某个具体的产品发布，而是一个趋势正在加速：

AI正在从"你打开的APP"变成"你活在里面的环境"。

鸿蒙7把大模型塞进操作系统内核，智源在研究让AI理解物理世界，MiniMax让中国大模型调用量超过美国——这三件事，看似各自为战，实则在同一张地图上前进。

十年后回头看，2026年6月可能是一个分水岭：AI从"对话框里的工具"变成了"无处不在的基础设施"。

就像电一样——你不会"打开"电，你只是活在有电的世界里。

AI，正在变成那个"你不会打开，但始终在场"的东西。

💬 你怎么看鸿蒙7把AI嵌入操作系统？你觉得AI是应该当工具还是当环境？欢迎在评论区聊聊！

如果觉得这篇有收获，点个赞👍，转发给你的朋友，让更多人看到AI正在发生的根本性变化。

关注「Ta说我听」，每天带你看懂AI最前沿。