公众号发布说明 – 2026-04-27
-
2026年Q1国内GPU租赁市场规模达19.7亿元,同比增长68.3% -
H100 GPU一年期租约价格从2025年10月的1.70美元/小时飙升至2026年3月的2.35美元/小时,涨幅近40% -
英伟达Blackwell系列单小时租金已达4.08美元,两个月上涨48% -
国内日均Token调用量已超140万亿,较2025年底增长40%以上
2. AI Agent崛起,推理算力需求爆发
-
AI从”训练驱动”转向”推理驱动”,推理算力需求在2026年将占据总消耗的三分之二 -
AI Agent、多模态应用等高频场景单次交互的Token消耗量可达传统AI的10至100倍 -
Claude Code等多智能体工作负载推动算力消耗呈抛物线式增长
3. 商业模式升级:从”卖机器”到”卖Token”
-
算力租赁厂商正从单纯出租裸算力升级为模型服务或Token分成模式 -
头部企业净利润预告同比增长数倍,协创数据Q1净利润预增284%-402%
4. 2026算力券政策落地,GPU租用成本可降30%
-
工信部《关于开展普惠算力赋能中小企业发展专项行动的通知》出台 -
贵州、上海、山东、广东等地密集发布算力券政策 -
贵州算力券3.0版补贴比例提升至合同金额的30%,单家企业年度最高可兑现200万元
💰 价格波动
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
价格趋势判断:
-
高端算力(H100/Blackwell):供应紧张,涨价趋势延续 -
中端算力(RTX 4090/A100):价格稳定,性价比较高 -
2026年整体价格将维持高位,2027年随产能释放可能趋稳
📢 需求信息
1. 中小企业需求旺盛
-
72.1%的企业选择GPU服务器租用替代自有采购 -
65%的中小企业将租赁视为”生存项”而非备选项 -
RTX 4090八卡集群占据中高端算力租赁市场42.1%的份额
2. 国产模型出海带动需求
-
GLM-5、Kimi K2.5、MiniMax M2.5等国产模型在OpenRouter平台API调用量占比超过50% -
Kimi海外收入已超过国内收入,近20天收入超过2025年全年
3. 热门场景
-
中小企业:70B以内大模型微调、AI应用推理 -
科研机构:科学计算、分子模拟、高频量化回测 -
AI创业团队:多模态生成、小型大模型研发
💡 行动建议
1. 客户拓展方向
-
重点关注有AI应用需求的中小企业(10-50人团队) -
高校科研团队:价格敏感但需求稳定 -
AI创业公司:算力需求波动大,适合灵活计费模式
2. 产品策略
-
主推RTX 4090/A100等性价比机型,适合70B以内模型训练 -
可推荐抢占式实例(H100仅13元/小时),成本降幅达40% -
结合算力券政策,为客户争取30%补贴(需对接国补白名单服务商)
3. 竞争优势
-
强调”比大厂便宜20%-30%”的价格优势 -
突出快速开通、无需排队的服务优势 -
提供透明定价,避免隐性费用
4. 风险提示
-
关注极智算平台的价格政策变化 -
注意客户信用风险,长单客户需评估 -
算力价格波动较大,避免囤货压仓
📊 今日参考价格(2026-04-27)
国内主流平台RTX 4090价格参考:
-
智星云:1.5元/小时(低价标杆) -
星宇文算:1.86元/小时 -
行业均价:2.43元/小时
提示:如需更详细的价格对比或客户需求分析,可进一步查询。
本日报由算力情报站自动生成 | 每日7:30更新
夜雨聆风