摘要: 2026移动云大会,中国移动一口气发布了智能模型路由网关MoMA、全链路机密计算、AI-eSIM三张Token底牌。MoMA把300+模型聚合成一个入口,Token成本压降30%;机密计算让数据「可用不可见」,切进政务金融的安全刚需;AI-eSIM则把SIM卡变成Token经济的物理入口,用Byte+Token融合计费重新定义智能终端。三张牌背后,是运营商从「卖资源」到「卖智能」的关键一跃。
5月8日,苏州。中国移动一口气甩出三张Token底牌——平台、安全、入口,一次系统性「升维」。
今天这篇,把三张牌拆开讲透。
第一张牌:MoMA -- 把300+模型装进一个入口
MoMA(Mobile Model Architecture),官方名称「移动模型服务平台」。但它本质上是一个模型超市+智能调度中心。
模型聚合 -- 一站式调用
MoMA接入了超过300款主流AI模型。九天(中国移动自研)、DeepSeek、通义千问、Kimi、GLM、MiniMax……主流国产模型,基本全收。
对比数据:一般模型聚合平台接入50-100款模型,MoMA的300+在丰富度上大幅领先。
用户一次接入API,就能调用全部模型资源。不用逐个对接,不用分别签合同。
智能路由 -- 三种策略自动匹配
这是MoMA最核心的技术亮点。
你不用自己选模型。MoMA的智能路由引擎会根据你的需求,自动匹配最合适的模型,支持三种策略:
| 成本优先 | ||
| 效果优先 | ||
| 均衡优先 |
更关键的是故障切换:某个模型超时、限流或宕机了,MoMA秒级切到备用模型,业务不中断。
这对企业级用户意味着什么?不用再担心单点依赖。
成本压降 -- 30%怎么做到的
官方数据:单位Token成本压降约30%,资源占用率降低50%以上。
不是靠补贴,靠技术:
- 国产算力+自研推理引擎
:深度调优算子,适配华为昇腾、寒武纪、海光、天数智芯等国产芯片; - 智能路由调度
:把长尾请求导向低负载模型,提高资源利用率; - 智能缓存+上下文复用+Token压缩
:减少重复计算,压缩Token消耗量; - PD异构分离+KV缓存池化
:Prefill和Decode分开调度,缓存池共享,吞吐量提升20%、时延降低40%。
这套组合拳下来,不是某个环节省一点,是全链路挤压。
三档Token服务 -- 按安全等级分层
MoMA把Token服务分成三档:
| 普惠档 | ||
| 精品档 | ||
| 机密档 |
三档的区别不只是性能,更核心的是安全隔离等级。这直接引出第二张牌。
第二张牌:机密计算 -- 数据「可用不可见」
如果说MoMA解决的是「用得起、用得上」的问题,机密计算解决的是「敢不敢用」。
痛点很明确
政务数据、金融交易数据、能源调度数据——这些行业的核心数据,敢不敢放到云端让AI模型处理?
过去不敢。因为数据一旦出域,你就失去了控制权。
方案:全链路机密计算
MoMA的机密档把模型部署在机密容器里,基于硬件隔离技术,从芯片到应用全链路保障。
核心原则四个字:可用不可见。
模型能用你的数据做推理,但看不到原始数据。推理结果返回给你,数据不出域。
合作模式:中国移动+火山引擎
这次发布的「移动引擎机密模型服务」,是中国移动和火山引擎联合打造的:
基于全链路机密计算技术; 搭载Seedance 2.0大模型能力; 打造云端数据「安全屋」。
政务金融领域对多模态AI(尤其是视频分析)的需求正在爆发,而字节在Seedance视频模型上的能力是国产顶尖的。
护城河在哪
OpenRouter、AWS Bedrock这些海外平台也能做模型聚合,但机密计算+国产算力+运营商品牌,这个组合只有中国移动能凑齐。
在政务、金融、能源、央企内网这些场景,这不仅是技术优势,更是合规刚需。
Token经济的一个深层焦虑是信息不对称——平台掌握定价权、计量权、解释权,用户处于弱势。
机密计算某种程度上就是在回应这个焦虑:Token消耗可追溯、可审计、可闭环,每一笔Token消耗清晰透明。
第三张牌:AI-eSIM -- 把SIM卡变成Token入口
这是最出人意料的一张。
从通信凭证到Token入口
传统SIM卡是什么?一个联网工具。你的手机号、身份认证、通信通道,全靠它。
AI-eSIM加了什么?一个「智能大脑」和一个「安全底座」。
- 智能大脑
:实时调度云端模型,让AI玩具、智能手表、AI眼镜这些低算力终端也能用上大模型; - 安全底座
:把数字身份焊进芯片,金融级硬件安全,每台终端都有可信数字身份。
「1+3+9」体系
中国移动给AI-eSIM规划了一个完整的服务架构:
| 1个入口 | |
| 3大引擎 | |
| 9大场景 |
最关键的突破:Byte+Token融合计费
这是AI-eSIM对Token经营最重要的贡献。
全球首创「运营商码号即大模型账号」——你的手机号就是你的AI账号,流量和Token一站式订购。
这意味着什么?
以前,用户买流量是买流量,买Token是买Token,两笔账、两个平台、两套计费。
现在,Byte+Token融合运营,流量和AI服务打包在一起,一次下单、一个账单。
对用户:降低了使用门槛,不用理解什么是Token、什么是模型、什么是推理。
对运营商:把通信收入和Token收入绑在了同一张SIM卡上。入口不是APP,不是手机,而是那张你换不掉的SIM卡。
现实主义的审视
当然,AI-eSIM不是没有争议。
有评论指出,「智能大脑」的营销成分偏重——任何4G/5G eSIM理论上都能调度云端模型,AI-eSIM真正的差异化在于和中国移动云+MobileClaw的深度捆绑。
但也有评论认为,这种捆绑恰恰是优势:OpenAI做不了SIM卡,华为云做不了基础通信网络。这是运营商的独门资源。
AI-eSIM更务实的定位,可能是一个面向B2B和合规市场的AIoT基础设施,而不是什么「新通用入口」。
三张牌拼出来的Token经营版图
把三张牌放在一起看,中国移动的Token经营逻辑就清晰了:
| 平台 | ||
| 安全 | ||
| 入口 |
供给侧的价值链
移动云总经理孙少陵在大会上画了一条价值链:
「网络连接算力,算力生产Token,Token提供动能」
MoMA是「算力生产Token」的核心引擎——300+模型、智能路由、成本压降30%,把算力高效地转化为Token。
需求侧的服务链
还有那条服务链:
「智能体使用Token,Token拉动算力,算力激发流量」
AI-eSIM是「智能体使用Token」的物理入口——SIM卡即AI账号,Byte+Token融合计费,让Token消耗直接拉动通信流量。
闭环形成
MoMA生产Token → 机密计算保障安全 → AI-eSIM分发Token → Token消耗拉动算力需求 → 算力需求驱动网络升级 → 网络升级反哺Token生产。
一个闭环。
写在最后
三张牌,三个维度:平台聚合、安全保障、物理入口。
MoMA解决了Token的生产效率和选择问题,机密计算解决了Token的信任问题,AI-eSIM解决了Token的分发问题。
但Token经营的核心命题——谁掌握定价权,谁定义价值标准——这三张牌还没有给出终极答案。
中国移动目前给出的,是一个完整的框架。框架的填充,需要九天模型的持续迭代、需要AI-eSIM的规模化落地、需要机密计算从政务金融拓展到更广泛的行业。
核心结论: 移动云大会亮出的三张Token底牌,让运营商第一次有了从「卖资源」到「卖智能」的系统化路径。但路径不等于终点——真正的突破,取决于「九天」能不能在300+模型中站上C位,取决于Byte+Token融合计费能不能跑通规模化的商业闭环。
夜雨聆风