

近日,国际权威AI模型评测平台Artificial Analysis在其官网及海外社交媒体官方账号上,高规格发布了对中国移动九天大模型的最新评测成果,并罕见配发长文点赞。这是该平台首次对一家中国中央企业进行如此深度的正面宣传与推介。

Artificial Analysis官方发文指出:“中国移动刚刚发布了JT-35B-Flash……这标志着中国移动在AI领域的持续专注与显著进步。”
这不仅是国际权威技术评测机构对中国移动九天大模型的权威认可,更是中国AI核心技术实力“走出去”、获得全球话语权的又一高光时刻。
专业课程体系化设计,夯实平台应用根基
全球权威“标尺”首次聚焦中国央企
Artificial Analysis被誉为国际AI领域的“公平标尺”。其最大特点是不依赖厂商自报数据,完全通过统一的评测框架与自动化流程进行独立测试,评测方法、数据样本与评分逻辑全部公开透明,极具公信力。
在该平台最新发布的Intelligence Index v4.0榜单中,中国移动九天研究院自主研发的九天JT-35B-Flash大模型,在“非慢思考模型”类别中排名全球第13,在“参数量小于150B”的轻量化细分赛道中,更是高居全球第2。
Artificial Analysis特别强调,九天JT-35B-Flash与此前版本相比,智能指数大幅提升11个点,展现出惊人的迭代速度与技术突破能力。
中国移动重新定义“央企速度”,让模型跑出“加速度”
Artificial Analysis的评测数据显示:
- 智能指数跃升11分:九天JT-35B-Flash得分36分,相比前代JT-MINI的25分,猛增44%,证明了央企业在AI核心技术研发上的“加速度”。
- 全能与幻觉控制双突破:在AA-Omniscience全能评测中,得分提升42分,其中幻觉率降低63%,准确率提高28%。这意味着模型“说话更靠谱”。
- 工具调用能力全球第一:在客户服务场景工具调用评测t²-Bench中,九天JT-35B-Flash以99%的准确率高居全球第一,超过GLM-4.7-Flash等知名模型。这一能力与中国移动的通信业务高度契合,意义重大。
- 智能体能力跻身第一梯队:模型Agentic Index(智能体指数)达52分,展现出卓越的自主任务执行能力,为“AI智能体”落地打下坚实基础。
Artificial Analysis在官方发文评价:“这组数据表明,九天JT-35B-Flash已成为轻量化、高效率、高智能模型的标杆。”
分数排名是其次,强在“用得起、用得好”
与动辄千亿参数的“巨无霸”模型不同,九天JT-35B-Flash走的是轻量化、高效率、安全可信的技术路线。Artificial Analysis特别指出,该模型展现出极高的Token效率,输出仅用约1700万Token即可完成全套智能指数测试。
这意味着什么?
- 成本更低:企业调用模型的算力成本大幅下降。
- 响应更快:适合客服、办公辅助等高频实时交互场景。
- 部署更灵活:可轻松嵌入私有云甚至终端设备,满足政企数据安全需求。
目前,九天JT-35B-Flash已主要面向中国移动的企业客户开放,正为政务、医疗、金融、能源、交通、通信等行业提供安全、高效、可控的AI能力。尤其值得一提的是,该模型以安全为最低门槛,助力央国企、政府等单位用上世界领先的AI模型技术,让“顶配”AI真正实现安全可控、落地可用。
未来:让AI能力成为“水电一样的基础设施”
“独行快、众行远”。中国移动表示,将持续建设AI基础能力,创新AI应用服务,发挥平台优势和生态力量,在国家人工智能产业发展中挑大梁、走在前、作示范。
Artificial Analysis此次首次力推中国央企,是对中国移动九天大模型技术实力的权威背书,更是中国AI从“跟跑”到“领跑”的一个有力注脚。未来,中国移动将继续以安全可信、自主可控、注重实效为底色,让前沿AI技术真正惠及千家万户、千行百业。

供稿 | 中国移动科学技术协会人工智能学部
编辑 | 王思博
初审 | 陈童童
复审 | 边瑞





夜雨聆风