欢迎大家关注“凯哥讲故事系列”公众号

本文配有完整 PPT 如需要
加凯哥微信,将文章转发朋友圈截图发给笔者,即发 PPT 完整版

2026 年 4 月,英伟达圣克拉拉总部,负责应用深度学习研究的副总裁 Bryan Catanzaro,推开了 CEO 办公室的门。
他这次来,是找老板要卡的。具体说,是要一批 H200,给团队跑实验用。最近他手下的研究员一直抱怨,卡不够,实验做不动。
黄仁勋抬头看了他一眼,从皮夹克里掏了句话出来:
不好意思,那些卡已经卖掉了。
Catanzaro 在英伟达的资历,不是一般的深。十多年前,这家公司还没决定要押注 AI 的时候,正是他发现了一件事——
GPU 这东西,迎来了一批新买家。是大学实验室里的研究员。他们没什么钱,但他们买得疯狂。
老黄因此下了决心,把整间公司压上 AI 这条赛道。今天英伟达三万亿美元市值的每一分钱,都是从那个判断里长出来的。
而那个当年帮英伟达赌对了的人,现在,买不到自家的 GPU。
1. 卖铲子的没铲子了
比"卖铲子的没铲子了"更戏剧性的事,发生在山景城。
去年夏天,DeepMind 的研究员 Andrew Dai,判断视觉推理这个方向值得做,就给公司打了一份 TPU 资源申请。
申请没批。
理由不是方向不好,而是项目不能服务下一代 Gemini。当时谷歌内部的原则很清楚——算力优先级,先给付费客户,然后给旗舰模型,剩下的,再说。
华盛顿大学一位计算机系的教授后来评论这件事,说了一句很狠的话:
在谷歌内部,每一块 TPU 的背后,都站着三个等的人。
Andrew Dai 最后选择了离职创业。和他一起走的,还有 Anna Goldie。
谷歌挽留 Goldie 的筹码,不是加薪,也不是期权,是——更多的 TPU。
但她还是走了。她拿到了 3.35 亿美元融资。她后来跟人说:
这笔钱能买到的算力,跟当初 DeepMind 挽留我开出的条件,几乎一样多。
公司用算力挽留员工,员工用融资换算力。
这是这一轮 AI 周期里最魔幻的招聘故事。
2. 计划经济的味道
如果你听老一辈人讲过 80 年代,就知道这个味道很熟悉。
那时候买东西要票。买自行车要自行车票,买电视要电视券,买粮食要粮票,买布要布票。
不是没货,是没"指标"。
钢厂炼了一千吨钢,谁能拿到多少,要看计委的批条。煤矿挖了一千吨煤,谁先运走多少,要看铁道部能给几节车皮。
当年东北一个煤老板,煤都堆在井口了,但车皮调不来,煤就只能堆着,堆到下雨被冲走。
煤是没用的。批条才有用。
今天 Karpathy 在他的录像棚里,正卡在同一个问题上。
他在录 nanochat 教学视频,讲怎么从零训练一个小模型。录到第一步——"从云平台启动一台 8×H100 的服务器"——他自己愣了一下。
他知道,绝大部分学这门课的人,根本拿不到 8 张 H100。
评论区随后变成了大型比惨现场。有人贴 RunPod 后台截图,几乎所有 GPU 都是 unavailable。有人晒 Azure 的失败提示,capacity 不足。有人选了 Colab 的高端 GPU,被系统自动降档到 G4。
一个叫 Rohan Bansal 的开发者发了条推文,标题就六个字:
Holding on for dear life。
他账户里还有两个 H100 实例,他怕一松手,就再也回不来了。
3. 旧卡比新卡贵
如果说东西稀缺所以涨价,人们还能接受。但这一轮涨价的姿势,有点奇怪。
按常理,新一代出来,旧款降价。这是过去三十年所有消费电子的规律。B200 已经稳定供货,四年前的 H100 应该降价。
但 SemiAnalysis 的数据告诉你完全相反的故事。
H100 一年期的合约租金,半年涨了将近 40%。从 2025 年 10 月的每小时 1.70 美元,到 2026 年 3 月每小时 2.35 美元。现货市场更夸张,Lambda 上的 H100 报价已经到 4 美元出头,是两年前的两倍多。
最离谱的是,H200 的现货价格,比下一代的 B200 还要贵。H200 一夜涨了 29%,B200 反而平稳。
新卡比旧卡便宜——这是芯片行业三十年没见过的画面。
为什么?
因为算力市场从来不是按"谁最新"来定价的,是按"谁最确定"来定价的。
做工程的人都知道,最先进不等于最好用。真正值钱的是确定性。
H100 你跑过,别人 benchmark 也是 H100,调参的坑前人都踩过。新一代芯片再强,框架要适配,集群要重新调度,成本模型要重新算。
训练市场还没完全切到 Blackwell,推理、Agent、RL 后训练的需求又重重叠加上来。旧卡本来该退场,却因为"确定性"变成了刚需。
这跟当年的铁路车皮是一个道理。新铁路修通了,但旧线还在跑——因为旧线上的调度员、信号灯、补给站,都是熟的。
4. 5% 的浪费和不敢撒手的恐惧
更怪的事情还在后面。
一边是高端 GPU 抢不到,一边是算力中心利用率低得吓人。
Cast AI 出过一份报告,说不少大企业 GPU 集群的平均利用率只有 5% 左右。马斯克的 Colossus 算力中心,MFU(模型算力利用率)只有 11%。
也就是说,有 89% 到 95% 的卡,大部分时候在那儿空转。
那为什么不释放呢?
因为不敢。
你想象一下:你排了三个月队,云厂商销售突然给你打电话,说你要的卡现在只剩 36 张了,只能签一年长约,不要的话后面还有五家排队。
这时候你考虑的,已经不是"我真的需要这么多卡这么长时间吗",而是——
我敢不敢错过这单。
先签下来,哪怕闲置也不能松手。因为你松手交出去的,可能就再也拿不回来了。
这不是产能短缺,这是流动性短缺。
GPU 卡在企业的长约里,锁在云厂商的容量池里,困在长尾的"以防万一"里——但就是不出现在你今晚能点开购买的页面上。
短缺制造恐慌,恐慌制造囤积,囤积制造更深的短缺。
这跟 2020 年的口罩荒一模一样。N95 是真的不够吗?其实供给在恢复,但所有人都在囤——大厂囤几百万只,小厂囤几万只,普通人买十盒摆在家。结果就是——明明工厂在出货,药店货架就是空的。
GPU 今天就是芯片版的 N95。
5. 算力变成了筛选机制
这一轮的算力荒,跟过去不一样。
过去聊 GPU 紧缺,是顶级 AI Lab 的军备竞赛。OpenAI 抢卡,Google 抢卡,Meta 抢卡——这是大佬之间的事,跟普通人没关系。
但这一轮,焦虑往下沉了。
Karpathy 录教程,要先操心学员能不能搞到 8 张 H100。LocalLLaMA 社区天天讨论,能不能用本地 Mac 硬跑。高校研究员担心拿不到算力做实验。小创业团队担心,自己排队几个月的配额,被大客户横插一脚挤掉。
这背后已经不是"我要训练 GPT-5"的野心,而是一个朴素到几乎可怜的问题:
我只是想复现一个实验,为什么第一步就变成抢算力了?
过去这几年,AI 的开源运动确实降低了很多门槛。模型权重可以下载,代码可以 fork,数据集可以开放。
但算力把另一扇门关上了。
代码可以开源,H100 不能 fork。
真正的 AI 研究从来不只是看懂代码,你还得能跑通实验、能复现结果、能调参、能失败、能再来很多次。
如果每一次实验的前提,都是先去抢一组贵且不稳定的 GPU,那么开源的平等,就会被算力的不平等重新抵消。
从英伟达内部 Catanzaro 要不到卡,到 Goldie 拿融资换算力,再到 Karpathy 的教学视频卡在 8 张 H100 上——这些故事指向的是同一件事。
算力正在从"基础设施",变成"筛选机制"。
它筛掉的未必是没有想法的人,而是没有预算、没有配额、没有长期合同的人。
6. 国内的双重账
把视线拉回国内。
如果说海外开发者还在成熟生态里抢 H100/H200 的现货,那国内开发者面对的是另一种局面。
国内某云的 H100 排期,已经排到了 2027 年第一季度。"有钱也租不到"——这不是段子,是真实的客户反馈。
同时,高端卡的获取依然受政策限制,国产算力正在加速替代。这是好事,但 CUDA 体系切换到新生态的工程成本是真的存在。适配层、代码改动、调试周期、性能调优——对小团队不是轻松的迁移。
国内开发者今天要算两本账:一本是钱够不够,一本是生态够不够熟。
底层的处境其实是一样的。算力底座这个词听上去很大,落到具体的开发者那里,就是三个问题:
实例能不能启动。价格扛不扛得住。实验结果能不能复现。
AI 圈今天真正稀缺的,可能根本不是最新的芯片。
是普通人能稳定拿到、马上能用起来、能跑出结果的有效算力。
最先进的卡都堆在顶级 Lab 的机房里转着,99% 的开发者点开购买页面,看到的还是 unavailable。
模型在变得越来越开放。但跑得起这些模型的人,可能并没有变多。
这不是算力的胜利,也不是 AI 的胜利。
这是配额的胜利。
书籍简介

Springer Nature 出版社已经签约出版此书的全球版
敬请期待
“精益数据方法,是基于20年中国信息化,数字化市场的深度实践,超过100家大型头部企业的数字化转型规划,实施的落地总结沉淀出的,以数据要素为核心,以价值场景为抓手的中国特色的数字化转型方法论和体系化实践工具。
2023年已经出版了原创著作《精益数据方法论-数据驱动的数字化转型》,并且已经在多个全球头部行业领军企业落地。
精益数据方法,将精益思想深度融合到企业数字化转型领域,以创造价值,消除浪费为目标,打造高质量发展的数字化企业,助力企业在新的数字化时代获得高响应力,建立数据驱动的企业。”

如何找场景? 如何让场景落地?
如何让企业建立起持续生产高质量场景的组织能力?
精益数据训练营/解决方案架构师特训营
从数据到价值:精益数据工作坊
数字化咨询教练陪跑服务:
数字化转型规划 | 顶层设计 |企业创新与运营
IT战略规划 | IT服务管理体系 | 数据治理
往期推荐内容
智胜|Agent Discovery:AI 时代的价值互联网
智胜|从“智能体应用”到“智能互联网”:中国智能体政策的底层逻辑与产业范式跃迁
富贵研究所 | 我们花了 7 天,才把 AI 编程的起点搭起来
富贵研究所 | CEO 都开始写代码了,你的老黄牛思维还没醒悟?
凯哥 | AI 时代:TOGAF 没过时,但它已经不再够用了
富贵研究所 | AI 时代,答案越来越便宜,真正值钱的只剩一种能力










夜雨聆风