蚂蚁数科通过中国信通院“可信AI-Token服务质量评估”

随着大模型应用的不断深入和拓展，Token调用量持续攀升。根据中国信通院测算，2025年我国公有云大模型（对客侧）Token调用量达到2000万亿，同比增长超16倍。随着Token用量的激增，Token服务面临前所未有的质量保障压力，响应变慢、模型调包、请求排队、计费不透明等问题日益凸显，亟须建立统一、权威、可量化的服务质量评估体系，构建可信人工智能Token服务应用生态，支撑大模型普惠化落地。

中国信息通信研究院（简称“中国信通院”）长期关注高质量Token服务的发展，依据《人工智能词元（Token）服务质量能力要求》（AIIA/T 0303-2026）开展“可信AI-Token服务质量评估”工作。面向Token服务提供方与集成使用方，聚焦Token服务质量的服务能力、服务性能和经济成本三大核心维度，为Token服务全生命周期质量保障提供可量化、可验证、可复用的技术标尺与评价准则。2026年6月，蚂蚁区块链科技（上海）有限公司（以下简称“蚂蚁数科”）依托蚂蚁数科大模型服务平台DTMaaS，顺利通过可信AI-Token服务质量评估。本次评估围绕模型服务能力、Token服务性能、服务可信性、运维保障、用户体验及计量计费六大维度展开。经评估，平台在六大评估维度表现优异，各项指标均满足指标要求。

蚂蚁数科大模型服务平台DTMaaS 介绍

（以下内容由蚂蚁数科提供）

图1 蚂蚁数科大模型服务平台DTMaaS

“蚂蚁数科大模型服务平台DTMaaS”由蚂蚁数科自主研发，依托蚂蚁在AI领域多年积累的技术底座与工程实践，为企业提供从模型接入、推理服务到应用集成的全链路解决方案。

平台汇聚上百个国际知名大模型，覆盖通用对话、代码生成、多模态理解、行业专精等多种能力，客户可在平台上自助开通所需模型服务，通过标准化API即时调用，开箱即用，无需自建推理集群或管理基础设施。计费方面，平台支持按量付费与Token Plan订阅等灵活模式，适配不同规模和阶段的企业需求，让模型调用成本透明可控。

在模型供给层面，DTMaaS不仅整合了多家头部模型供应商渠道，更依托自持GPU算力池提供推理服务。平台内置高效的GPU资源管理调度和推理加速能力，通过智能显存优化、SLO感知的流量控制、算子融合、动态批处理、PD 分离、中心化统一缓存等推理加速技术，在保障服务稳定性和响应质量的前提下，显著降低单次推理的资源消耗，为客户提供更具性价比的模型调用体验。

无论是快速验证AI场景的初创团队，还是需要大规模稳定调用模型服务的企业客户，DTMaaS都能以统一的平台能力，缩短AI落地周期，降低技术门槛，让大模型真正成为业务增长的驱动力。

评估结果将于2026年6月16日“高质量Token服务研讨会”上正式发布，点击阅读原文报名参会。

中国信通院可信AI-高质量Token服务评估介绍

中国信通院正式推出“可信AI-高质量Token服务评估体系”，推出Token生产能力、Token运营能力、Token服务质量和Token安全能力的4大评估。本评估依据Token系列标准，一方面可衡量Token服务商围绕Token生产、运营、服务和安全的全栈能力，另一方面可为应用方提供产品和服务选型的参考和依据。

图2 可信AI-高质量Token服务评估体系

联系人

中国信通院人工智能研究所

程老师 15600298825（微信同号）

尹老师 18561320877（微信同号）