引言:一个时代的转折点
2026年2月26日,全球AI产业的历史记录本上写下了一个新坐标。据OpenRouter数据,中国AI模型周调用量首次超越美国,全球前五模型中中国占据四席,呈现出"集群式崛起"的态势。
两个月后的3月30日至4月5日,中国大模型周调用量达到12.96万亿Token,环比暴涨31.48%,连续五周超越美国,同期美国调用量仅为3.03万亿Token,不及中国的四分之一。
与此同时,持续两年多的AI价格战戛然而止。阿里云、腾讯云、百度智能云、智谱等主流厂商几乎同步调价,最高涨幅达463%。这标志着AI产业正在经历一个从"跑马圈地"到"价值变现"的系统性转折。
本文将围绕两大核心现象,系统解析其背后的原因、现状与趋势,并深入探讨这一浪潮对中国资产——特别是A股、港股科技指数及相关ETF和个股——的投资价值影响。
一、现象篇:两个核心数据背后的全景图
1.1 Token调用量:中国凭什么连续五周超越美国?
3月30日至4月5日当周,中国大模型周调用量达12.96万亿Token,相当于每天平均消耗近2万亿Token,"吞吐"掉维基百科全部内容的好几倍。调用量前六的模型清一色来自中国——阿里的千问(占据第一和第三)、小米的MiMo、阶跃星辰、DeepSeek、MiniMax。而支撑这些数据的"主力军"并非中国开发者:OpenRouter平台上美国用户占47%,中国仅占6%。硅谷的程序员、欧洲的创业公司、东南亚的企业主,正在用真金白银给中国AI投票。

2026年3月,中国日均Token调用量突破140万亿,较2024年初的1000亿增长超千倍,字节跳动的豆包大模型4月日均Token使用量已突破120万亿,与OpenAI、Google并肩成为全球仅有的三家日均消耗量超100万亿的公司。
1.2 涨价潮:从"降价内卷"到"集体涨价"
2024年,字节跳动以0.0008元/千Token的价格掀起大模型价格战,阿里云跟进将主力模型降价97%,Token以"厘"计价。但到了2026年,风向突变:
智谱率先两度涨价,GLM-5-Turbo API价格上调20%,套餐价格整体涨幅30%起;腾讯云混元系列模型输入价格从0.0008元/千Token涨至0.0045元/千Token,涨幅达463%;阿里云平头哥真武810E等算力卡服务涨价5%至34%,CPFS上涨30%;百度智能云AI算力服务同步上调5%至30%。涨价时间集中在2026年3月至4月,多数从4月18日起统一生效。

二、原因篇:三重力量共振下的产业拐点
2.1 需求端:AI Agent引爆"算力黑洞"
Token调用量爆发的核心驱动力,已从聊天机器人转向AI智能体。以"龙虾"(OpenClaw)为代表的Agent应用,让AI具备7×24小时在线、自主拆解任务、调用工具、读写文件、跨平台调度的能力,从对话助手升级为真正可落地的"数字员工"。
Agent的运作模式与聊天机器人在Token消耗上存在本质区别:聊天机器人是线性消耗——用户提问、模型回答,Token消耗与交互次数线性相关;而Agent需要执行复杂任务,模型思考的链路很长,还会进行大量的自我纠错、循环调用和工具使用,每次复杂操作背后都是海量Token的燃烧。这种非线性增长,使得调用量呈现爆发式攀升。Agent需求爆发后,全球模型调用量增长了7倍,头豹研究院数据显示,2025年下半年中国企业使用的大模型每天消耗37万亿Token,比上半年增长近三倍。
产业落地的广度和深度同样不可忽视。端侧AI跑进手机、汽车、智能家居,行业大模型扎进金融、制造、政务、电商、物流,AI智能体批量上岗——一个智能体扛起一个小组的日常工作。AI已经从"玩具"变成了真实的生产与生活工具。场景足够深、用户足够广、需求足够真,构成了中国AI调用量反超的根本原因。
2.2 供给端:电力与算力的"双重瓶颈"
电力是AI的第一性原理。英伟达CEO黄仁勋在3月的一篇博客中将AI产业拆解为能源、芯片、基础设施、模型、应用五个层面,强调"能源是AI的第一性原理,也是系统能产生多少智能的根本约束"。
美国电网正在遭遇严峻瓶颈。2026年初,微软因西弗吉尼亚州数据中心电网接入延迟,被迫自建燃气轮机;弗吉尼亚地区因电网承载能力不足,数据中心新项目审批暂停。三分之一输电线和近一半配电设施超过使用年限,2025年特朗普政府取消了223个新能源项目,80亿美元投资无法收回,全年清洁能源项目共取消243亿美元。OpenAI每年消耗50至70亿美元,收入仅34亿,依赖融资维持运营,投入越多亏损越大。
中国的电力基础设施则是另一个故事。2025年中国全社会用电量约10.37万亿千瓦时,超过美国两倍,高于欧盟、俄罗斯、印度、日本的总和。中国西部绿电成本可压到0.2元/度左右,工业用电整体成本低于欧美多数地区。"东数西算"工程更带来了结构性优势——数据中心建在西部绿电富集区,便宜的清洁能源就地转化为算力,再通过光纤输送到全国乃至全球,实现了"电力不出境、价值已跨境"的商业闭环。
这种电价优势直接体现在API价格上。美国Claude Opus 4.6的输入价格为5美元/百万Token,输出价格高达25美元/百万Token;而中国MiniMax M2.5的输入价格仅为0.3美元/百万Token,输出价格低于2.5美元/百万Token。同样是写代码的任务,用中国模型的成本只有美国竞品的十分之一。
算力硬件成本上涨是另一重供给约束。高端GPU、HBM等AI核心硬件产能扩张远跟不上需求爆发,内存等核心硬件及相关基础设施成本显著上涨,直接推高了云厂商和大模型公司的运营成本,成为涨价的重要推动力。
2.3 商业逻辑:告别"烧钱时代"
Token调用量暴涨、硬件与电力成本攀升,叠加Agent时代消耗量呈指数级增长,使得免费模式难以为继。智谱CEO张鹏直言,"把Token价格回归到正常的商业价值是必然选择"。
更关键的是涨价未抑制需求。智谱调价后调用量反增400%,阿里云、百度智能云等在涨价后仍保持增长。这证明市场对AI能力的依赖已经从"尝鲜品"变为"必需品",厂商敢于涨价是有坚实底气的。
三、现状与趋势篇:产业链全面重估
3.1 全产业链同步涨价
涨价已形成从模型层到基础设施层的全产业链普涨格局,各厂商涨幅集中在5%至463%之间,阿里云、腾讯云、百度智能云的AI算力服务同步上调,定价权正在从买方市场向卖方市场转移。
3.2 行业趋势:四大方向
第一,告别"全免费时代"。 "全免费、无分层"的模式将终结,未来将是基础服务免费、高级功能付费的格局。智谱已推出Claw体验月卡39元/月(含3500万Token)和进阶月卡99元/月(含1亿Token),分层定价成为主流。
第二,转向"价值战"而非价格战。 竞争焦点从单纯比拼参数和价格,转向商业落地和单位算力的成本效率。企业开始关注"Harness Engineering"(驾驭工程),即如何在Token成本上涨的背景下更高效地使用AI,而不是单纯追求调用量。
第三,推动行业洗牌与资源集中。 算力成本上升将淘汰缺乏核心技术和用户粘性的应用,促使资源向头部企业集中。OpenRouter平台调用量前十中中国占六席,头部集中效应明显。
第四,全球"算力代工"格局初现。 中国大模型正以价格优势切入全球AI产业链的执行环节,形成类似制造业的"算力代工"模式。海外开发者调用中国模型,电、芯片和冷却水均在中国完成,本质上是在出口算力服务。
四、投资价值分析:两条主线的系统性机会
4.1 核心分析框架:一"芯"、二"模"、三"云"
国联民生证券提出了"一芯、二模、三云"的框架来解析Token"通胀"受益方向,成为分析本轮AI投资机会的权威框架:
短期(优先关注) :云平台——商业模式清晰、落地快、盈利改善有望更快速兑现
中期(重点关注) :模型厂商——凭借更低成本承接更高频调用,放大流水和订阅收入
长期(看好弹性) :国产算力芯片——受益于推理需求扩张和自主可控趋势
Agent的持续运行将显著放大Token消耗、联网搜索、状态存储、长连接和多步推理需求,进而带动芯片、模型、云平台三个层面的系统性重估。
4.2 主线一:A股算力产业链
(1)芯片层:寒武纪、海光信息、云天励飞
Agent时代的算力需求已不限于GPU推理,还包括工具调用、环境构建、任务调度、长期记忆和高并发CPU协同,算力底座的重要性全面提升。国产算力厂商一方面受益于Token通胀带来的推理需求扩张,另一方面受益于国产替代和自主可控趋势。
海光信息(688041)2025年实现营业收入143.77亿元,同比增长56.92%;归母净利润25.45亿元,同比增长31.79%,研发投入45.69亿元,研发人员占比达82.99%。公司以CPU+DCU双芯构筑差异化优势,在AI大模型领域渗透率与认可度双提升。
寒武纪作为国产AI芯片龙头,受益于推理需求扩张和自主可控趋势,在当前算力供需错配格局中占据核心位置。云天励飞在AI视觉和边缘计算领域具备差异化竞争力。
(2)模型层:MiniMax、智谱AI
Agent时代驱动大模型coding能力需求非线性增长,MiniMax的优势在于高性价比、长上下文和编程/视觉执行能力,更适合被高频工作流调用;智谱具备全球领先的coding技术能力,价格上调反映出模型层正在从价格战转向分层订阅和定价权提升。
智谱API调价后调用量反增400%,ARR同比增长60倍至17亿元,证明了其商业模式的爆发力。MiniMax M2.5在SWE-Bench评测中得分80.2%,仅比Claude Opus 4.6低0.6%,编程能力接近海外顶尖模型。这两家作为尚未上市的AI"新势力",后续上市后有望成为A股/港股AI板块的重要增量标的。
(3)云层:金山云、网宿科技、优刻得
云是本轮高确定性的"卖铲人"。金山云、优刻得等受益于一键部署、模型托管、知识库、Agent平台订阅和企业级治理需求;网宿科技受益于机器流量提升后,CDN、API网关、边缘安全和流量治理价值上移。
云层商业模式清晰,Token通胀直接带来流量和算力消耗增长,盈利能力改善有望更快速在财报中兑现,是当前确定性较高的配置方向。
(4)算力基础设施产业链
除上述主线外,IDC及算力租赁、服务器及相关配套供应商也是受益方向。国金证券预判2026年算力产业链将进入"全链通胀"周期,行业景气度将从核心芯片向AIDC、云与算力服务、配套电力设备及服务器等环节全面外溢。
4.3 主线二:港股科技板块——稀缺性与估值洼地的双重叠加
(1)估值已进入历史底部区域
恒生科技指数经历半年调整,当前估值处于历史低位:

恒生科技指数PE-TTM约20.8倍,处于近十年12.88%的估值分位,意味着估值低于市场87%以上的时间周期。市净率2.53倍处于近一年0.81%分位,低于近一年99.19%的时间,已具备显著估值优势。横向对比全球主要科技指数,恒生科技指数较创业板指折价近50%,较纳斯达克指数折价近40%。
(2)资金持续大幅流入,南向资金成为重要支撑
估值洼地效应正在吸引大量资金通过ETF渠道流入港股科技板块:
恒生科技主题ETF自2025年8月以来已连续34周获资金净买入,期间合计净买入达1390亿元
2026年以来,投资港股市场的ETF整体净流入额达504.49亿元,较去年同期的净流出210.33亿元,资金流向显著逆转
- 恒生科技ETF天弘(520920)最近30个交易日累计获资金净流入约20亿元,最新规模达157.36亿元,年初至今规模增长率约40.53%-
恒生科技ETF(513130)2026年以来累计获约26亿元资金加仓,最新规模达473.60亿元,持有人户数超22万户-
(3)AI叙事与基本面共振
恒生科技指数成分股多为中国AI产业的直接参与者。
腾讯控股已完成组织架构调整,将QQ浏览器、搜狗输入法等C端AI产品线整合至云与智慧产业事业群,加速大模型在多项产品中的落地应用。
阿里巴巴的通义千问系列大模型在OpenRouter平台上调用量爆发式增长,单周环比增幅超300%。
小米凭借MiMo-V2-Pro模型以免费/低价策略在OpenRouter等平台快速吸引开发者,单周调用量一度登顶国产前列。
当前港股科技板块处于"利空出尽"窗口期。3月港股限售股解禁高峰结束,叠加互联网公司年报披露完毕,广发证券认为3月下旬可能是港股利空出尽的关键节点。AI大模型需场景变现,C端应用进展或催化恒科基本面,外资对互联网板块具备定价权,若后续海外流动性反转,相关标的弹性可能更大。
4.4 具体标的推荐
ETF基金

恒生科技ETF(513130)是市场上规模最大、流动性最强的港股科技ETF,最新规模达473.60亿元,日均成交额58.36亿元,持有人户数超22万户,管理费率仅为0.2%,适合投资者低成本布局港股科技板块。
个股标的


五、不同风险偏好的配置方案
5.1 激进型配置(高风险偏好,弹性优先)
恒生科技ETF(513130) :60%——核心仓位,捕捉港股科技整体弹性
海光信息(688041) :20%——国产算力芯片龙头,业绩高增长
金山云(03896.HK) :10%——云平台高弹性标的
网宿科技(300017) :10%——CDN受益于流量增长
预期年化:15%-20% | 预期最大回撤:-25%至-30%
5.2 稳健型配置(中等风险偏好,均衡布局)
恒生科技ETF天弘(520920) :40%——港股科技核心配置
海光信息(688041) :20%——国产算力龙头,业绩确定性强
港股通科技ETF广发(159262) :20%——更广泛的港股科技覆盖
网宿科技(300017) :10%——云基础设施受益
寒武纪:10%——芯片层长期配置
预期年化:12%-15% | 预期最大回撤:-15%至-20%
5.3 保守型配置(低风险偏好,稳定性优先)
恒生科技ETF(513130) :50%——规模大、流动性好、管理费低
港股通科技ETF广发(159262) :30%——分散配置
优刻得(688158) :10%——云服务稳健增长
现金/货币基金:10%——流动性缓冲
预期年化:8%-10% | 预期最大回撤:-10%至-15%
六、风险提示
估值泡沫风险:部分AI概念股股价涨幅巨大,估值已反映了极为乐观的预期。恒生科技指数虽处历史低位,但若AI商业化落地不及预期,仍存在回调风险。
算力供给扰动:高端GPU产能不足、全球芯片供应链紧张等硬件供给瓶颈依然是制约行业发展的核心风险,可能进一步推高成本。
政策监管不确定性:AI作为强监管行业,数据安全、算法合规、跨境数据传输等方面的政策变化,可能对相关公司的业务模式产生重大影响。
模型价格战反复风险:若行业竞争加剧,不排除部分厂商重新降价抢占市场份额,侵蚀当前涨价带来的利润改善预期。
地缘政治风险:港股科技板块对地缘政治因素敏感度较高,中东局势、中美关系等外部变量可能影响外资流入节奏和风险偏好。
Agent落地节奏风险:若Agent应用推广速度低于预期,Token需求非线性增长可能不及预期,影响产业链整体景气度。
流动性风险:部分港股科技ETF规模较小,大额交易可能产生较大冲击成本,建议优先选择规模大、流动性好的产品。
结语:站在产业拐点上的投资抉择
中国AI Token调用量超越美国、大模型集体涨价,不是两个孤立的事件,而是同一个宏观叙事的一体两面。前者证明了需求的爆发式增长,后者标志着商业模式的成熟拐点。当AI从"烧钱换市场"走向"价值变现",掌握核心算力资源、具备"模型+算力+应用"一体化能力的中国科技企业,正站在一个系统性价值重估的起点上。
对于投资者而言,当前既是机遇窗口——港股科技指数处于历史估值底部、南向资金持续流入、AI叙事不断强化;也是风险关口——地缘政治不确定性、算力供给瓶颈、商业化落地节奏均需密切关注。在"一芯、二模、三云"的投资主线下,合理配置港股科技ETF和A股算力产业链核心标的,将是把握本轮AI浪潮投资机会的关键。
⚠️ 免责声明:以上分析基于公开历史数据及研报观点,不构成任何投资建议。过往业绩不代表未来表现,市场有风险,投资需谨慎。本文中提及的具体标的仅为基于公开信息的分析示例,不构成买入或卖出推荐。投资者应根据自身风险承受能力、投资期限和财务状况独立做出投资决策,或咨询专业投资顾问。
欢迎入群讨论:

夜雨聆风