
Token的运营开始形成一个新的中间层市场。Token运营开始出现类分销模式,即批量采购AI厂商API额度,并加价转售给终端用户。
Token分销模式核心三方角色包括:1)模型方:如字节跳动(Seedance系列)、阿里巴巴(Qwen系列)、智谱(GLM系列)、月之暗面(Kimi系列)、深度求索(DeepSeek系列)等,是Token源头供给方。2)代理平台:承接上游模型资源并分销给终端用户,是Token分销中转与统一服务的中间枢纽。3)终端用户:实际付费购买并调用消耗Token,包含个人、开发者、企业等。 中国日均Token调用量显著增长,国产大模型能力实现跃迁。2024年年初,中国日均Token调用量为1000亿;至2025年底,跃升至100万亿;2026年3月,已突破140万亿,两年增长超千倍。OpenRouter数据显示,截至2026年5月7日的最新一周榜单中,腾讯Hy3preview(free)位居调用量榜首,前五、前十、前二十名分别有2款、6款、9款国产大模型。
全球AI算力、模型、能源等核心资源在各国各地区呈现不均衡的分布格局。一方面,海外头部大模型如OpenAI、Anthropic,受地域访问限制、合规规则与支付门槛制约,无法直接触达包括中国大陆开发者在内的海量全球用户。另一方面,以DeepSeek为代表的国产优质大模型,在走向国际市场时,又面临海外本地化适配、渠道铺设与用户获客的天然壁垒。催生AIToken的跨境流转、聚合路由与分层分销的市场需求。
Token分销的盈利模式。1)Token转售利差:即在模型厂商(上游)和AI需求方(下游)之间做流量聚合与分发,赚取差价。2)技术溢价:主要是通过自研推理加速引擎,依靠算力效率差获取超额技术毛利。3)企业增值服务:面向企业端提供AI相关的技术支持,如prompt工程、Agent编排、模型选型等。 关注场景Token下的企业增值服务,有望成为Token分销的服务溢价来源。如硅基流动建立了企业级MaaS平台架构,面对企业用户提供模型训练调优、部署推理、应用开发支撑三层能力,包括数据处理、模型微调、Prompt工程和RAG等,最终以标准化API形式交付给能源、金融、政府等多行业。国内营销公司的客户资源涉及短剧、漫剧、游戏和电商等领域,场景Token消耗需求真实且持续。
报告全文可扫描下方图片二维码进入星球社群查阅下载

(报告来源:华源证券。本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

夜雨聆风