当前时间: 2026-04-13 02:33:07
分类:办公文件
评论(0)
AI算力及Token需求行业观点更新·市场关注方向变化:当前算力领域市场关注重心正从英伟达产业链向谷歌产业链、国产算力产业链转移。此前英伟达产业链研究已较为充分,目前市场处于等待业绩兑现的阶段;而国产算力此前因业绩兑现度不高、估值难以测算被市场忽视,经历一段时间回调后当前位置性价比凸显,是近期市场风向变化的核心方向。2025年至2026年国产算力持续取得突破,产能、生态融入、政策配比、量产出货等瓶颈不断得到解决,现阶段关注国产算力核心需跟踪产业进展,同时重视竞争格局的分析。·Token涨价催化与机会:算力Token涨价的核心原因是供需失衡,需求激增而供给不足。从需求端来看,2025年至2026年Token调用量暴增,2025年open router模型周调用量不足2T,2026年近两周周度调用量已达20T左右,较2025年同期增长10-20倍。CAPEX投入层面,海内外云厂差异显著,海外四大CSP 2025年CAPEX约为4000亿美元,2026年增速达50%以上,而国内大厂CAPEX投入规模此前远低于海外,后续仍有较大增长空间。Token涨价信号将带来全产业链投资机会:a.直接利好云厂,盈利水平将得到改善;b.算力租赁环节也将直接受益;c.带动后续CAPEX扩张,AIDC、国产算力全链条从芯片、液冷、电源到组装均有发展机会。目前研究团队已对赛道进行细分覆盖,分别覆盖芯片与存储、组装、液冷等方向,投资人可就相关观点、数据详询团队。·芯片环节分享预告:后续将由研究团队成员董雯丹聚焦国产算力芯片赛道,围绕该环节近期的变化情况展开更为详细的分享。·Token需求增长概况:Token是算力产业商业化闭环与长期增长的核心需求锚定,自2024年初的千亿规模到2026年当前,国内Token需求已实现爆发式增长。据全球最大API聚合平台Overnight数据显示,Token周调用量从2025年3月的2万亿增长至2026年3月的20万亿,同比增幅达10倍。Token需求爆发的核心驱动力来自AI应用层从浅层次体验向深度化刚需的范式变迁,AI Agent、多模态技术的商业化落地进一步强化了Token消耗逻辑。·需求爆发驱动因素:驱动Token需求爆发的核心因素主要有两点:a. AI Agent技术落地大幅提升Token消耗。对比传统一问一答交互模式下单次对话仅消耗500~5000token,OpenAI的AI Agent可自主拆解任务、调用工具,完成报告、代码工程等复杂任务,且支持24小时运行,单次消耗可达数十万至数百万,推动Token消耗从按需触发变为持续运行。b. 多模态技术全面商业化放大消耗规模。文本、图像、音频、视频等跨模态生成可实现单任务Token消耗量级跃升,文本500词约消耗375token,图片消耗是文本的10倍甚至百倍,一分钟视频消耗较文本翻数百倍以上。其中字节PixVerse 2.0生成15秒视频需消耗30.88万token,一部AI漫剧的Token消耗可达上亿,多模态重负载场景的规模化落地是Token需求暴涨的第二大推手。·B端需求落地情况:当前Token需求不仅来自C端的增长,更呈现向B端高频刚需倾斜的趋势。据火山引擎总裁披露口径,累计Token使用量超过1万亿的企业客户已从2025年底的100家增长至2026年3月的140家,仅三个月就新增40家,标志着AI已从免费试用阶段进入企业规模化付费阶段。同期智谱AI发布的上市后首份财报显示,其2025年全年收入达7.24亿元,同比增长132%;MAS API平台的年度经常性收入(ARR)突破17亿元,同比实现60倍的增长。整体来看,Token需求在C端和B端均处于快速爆发阶段。·国产大模型性价比优势:国产大模型已在性能、成本、生态层面实现全面突破,极致性价比优势为下游需求释放扫清了成本障碍。成本方面,海外顶尖模型如GPT-4.5百万Token调用成本不到10美元,国产DeepSeek、千问、Minimax等模型仅需0.3~1美元,成本仅为前者的1/10~1/16。该成本优势并非来自价格战,核心支撑来自两方面:一是技术架构创新,千问三等模型采用MO混合专家架构,推理仅需激活部分参数,可使单位Token能耗下降60%;二是国内能源成本优势,国内西部绿电成本约为0.1~0.2元/度,仅为欧美地区的1/4~1/10,而电力成本占AI运营成本的60%~70%,让国产模型在成本控制上较欧美具备碾压级优势。以Minimax发布的GLM-4模型为例,其综合成本仅为GPT-4.5的8%,推理速度快1倍,性价比竞争力突出。·国产算力芯片替代进展:国产算力芯片的规模化替代已出现明确标志。当前百度、阿里、腾讯、字节、快手等头部互联网企业,推理场景已实现100%国产算力替代,训练场景也处于加速替代进程中。2026年是国产算力芯片出货快速增长元年,预计全年国产芯片总出货量将突破300万片,同比增长3倍以上;随着出货规模化上量,芯片毛利率将逐步提升,摆脱赔本赚吆喝的困境,叠加国产算力租赁市场快速崛起,进一步印证了国产算力芯片的市场认可度。展望后续,下半年950D、T5G、6690等高端芯片将实现规模化应用,LPDDR4低精度优化、Chiplet工艺、液冷技术、光互联、万卡集群、超节点方案等将成为国产芯片标配,同时字节、阿里、百度等互联网大厂自研芯片加速商业化,将与头部芯片厂商形成国产算力芯片双极引领格局。当前处于2026年Q2节点,国产算力芯片发展已迎来历史性转折,Q2是布局国产算力的最佳时点。
基本
文件
流程
错误
SQL
调试
- 请求信息 : 2026-04-13 15:53:57 HTTP/1.1 GET : https://www.yeyulingfeng.com/a/520116.html
- 运行时间 : 0.123412s [ 吞吐率:8.10req/s ] 内存消耗:4,746.84kb 文件加载:145
- 缓存信息 : 0 reads,0 writes
- 会话信息 : SESSION_ID=38f7e4857b10496a3229e03e3fed904d
- CONNECT:[ UseTime:0.000442s ] mysql:host=127.0.0.1;port=3306;dbname=wenku;charset=utf8mb4
- SHOW FULL COLUMNS FROM `fenlei` [ RunTime:0.000576s ]
- SELECT * FROM `fenlei` WHERE `fid` = 0 [ RunTime:0.002247s ]
- SELECT * FROM `fenlei` WHERE `fid` = 63 [ RunTime:0.000290s ]
- SHOW FULL COLUMNS FROM `set` [ RunTime:0.000471s ]
- SELECT * FROM `set` [ RunTime:0.000228s ]
- SHOW FULL COLUMNS FROM `article` [ RunTime:0.000644s ]
- SELECT * FROM `article` WHERE `id` = 520116 LIMIT 1 [ RunTime:0.010282s ]
- UPDATE `article` SET `lasttime` = 1776066837 WHERE `id` = 520116 [ RunTime:0.008430s ]
- SELECT * FROM `fenlei` WHERE `id` = 64 LIMIT 1 [ RunTime:0.005109s ]
- SELECT * FROM `article` WHERE `id` < 520116 ORDER BY `id` DESC LIMIT 1 [ RunTime:0.000473s ]
- SELECT * FROM `article` WHERE `id` > 520116 ORDER BY `id` ASC LIMIT 1 [ RunTime:0.009014s ]
- SELECT * FROM `article` WHERE `id` < 520116 ORDER BY `id` DESC LIMIT 10 [ RunTime:0.004064s ]
- SELECT * FROM `article` WHERE `id` < 520116 ORDER BY `id` DESC LIMIT 10,10 [ RunTime:0.002253s ]
- SELECT * FROM `article` WHERE `id` < 520116 ORDER BY `id` DESC LIMIT 20,10 [ RunTime:0.004462s ]
0.125230s