随着大模型应用的不断深入和拓展,Token调用量持续攀升。根据中国信通院测算,2025年我国公有云大模型(对客侧)Token调用量达到2000万亿,同比增长超16倍。随着Token用量的激增,Token服务面临前所未有的质量保障压力,响应变慢、模型调包、请求排队、计费不透明等问题日益凸显,亟须建立统一、权威、可量化的服务质量评估体系,构建可信人工智能Token服务应用生态,支撑大模型普惠化落地。
中国信息通信研究院(简称“中国信通院”)长期关注高质量Token服务的发展,依据《人工智能词元(Token)服务质量能力要求》(AIIA/T 0303-2026)开展“可信AI-Token服务质量评估”工作。面向Token服务提供方与集成使用方,聚焦Token服务质量的服务能力、服务性能和经济成本三大核心维度,为Token服务全生命周期质量保障提供可量化、可验证、可复用的技术标尺与评价准则。2026年6月,蚂蚁区块链科技(上海)有限公司(以下简称“蚂蚁数科”)依托蚂蚁数科大模型服务平台DTMaaS,顺利通过可信AI-Token服务质量评估。本次评估围绕模型服务能力、Token服务性能、服务可信性、运维保障、用户体验及计量计费六大维度展开。经评估,平台在六大评估维度表现优异,各项指标均满足指标要求。
蚂蚁数科大模型服务平台DTMaaS 介绍
(以下内容由蚂蚁数科提供)


图1 蚂蚁数科大模型服务平台DTMaaS
“蚂蚁数科大模型服务平台DTMaaS”由蚂蚁数科自主研发,依托蚂蚁在AI领域多年积累的技术底座与工程实践,为企业提供从模型接入、推理服务到应用集成的全链路解决方案。
平台汇聚上百个国际知名大模型,覆盖通用对话、代码生成、多模态理解、行业专精等多种能力,客户可在平台上自助开通所需模型服务,通过标准化API即时调用,开箱即用,无需自建推理集群或管理基础设施。计费方面,平台支持按量付费与Token Plan订阅等灵活模式,适配不同规模和阶段的企业需求,让模型调用成本透明可控。
在模型供给层面,DTMaaS不仅整合了多家头部模型供应商渠道,更依托自持GPU算力池提供推理服务。平台内置高效的GPU资源管理调度和推理加速能力,通过智能显存优化、SLO感知的流量控制、算子融合、动态批处理、PD 分离、中心化统一缓存等推理加速技术,在保障服务稳定性和响应质量的前提下,显著降低单次推理的资源消耗,为客户提供更具性价比的模型调用体验。
无论是快速验证AI场景的初创团队,还是需要大规模稳定调用模型服务的企业客户,DTMaaS都能以统一的平台能力,缩短AI落地周期,降低技术门槛,让大模型真正成为业务增长的驱动力。
评估结果将于2026年6月16日“高质量Token服务研讨会”上正式发布,点击阅读原文报名参会。
中国信通院可信AI-高质量Token服务评估介绍
中国信通院正式推出“可信AI-高质量Token服务评估体系”,推出Token生产能力、Token运营能力、Token服务质量和Token安全能力的4大评估。本评估依据Token系列标准,一方面可衡量Token服务商围绕Token生产、运营、服务和安全的全栈能力,另一方面可为应用方提供产品和服务选型的参考和依据。

图2 可信AI-高质量Token服务评估体系
联系人
中国信通院人工智能研究所
程老师 15600298825(微信同号)
尹老师 18561320877(微信同号)
夜雨聆风