一杯咖啡,AI读完一座图书馆|电的二次出海·模型篇
写在前面:从电到词元,到一杯咖啡
《电的二次出海》系列已经走了七篇。
第一序章四篇,BuilderPi带读者把中国"电变词元"的产业地理跑了一遍——西部生产、中部调度、东部出海。
第二序章已经写完三篇——能源篇讲"电从哪来",基建篇讲"电怎么传",算力篇讲"电怎么变成算力"。
到这一篇,我们终于要回答整个系列里最关键也最反直觉的那个问题——
算力变成什么,卖给全世界?
答案是词元(Token)。
如果说能源、基建、算力是产业链的"前段工厂",那模型层就是真正的"加工车间"——把电变成词元,再把词元打包卖给应用、卖给企业、卖给全世界的开发者。
但2026年4月最后一周开始,这个加工车间,正在经历一场前所未有的塌陷。
塌陷有多剧烈?
一杯咖啡的钱,今天能买的AI算力,相当于让AI"读完"一整座图书馆。
这不是夸张,是BuilderPi算过账的真实数字。
而BuilderPi最关心的问题是——当模型变得这么便宜,到底是谁在赚钱?谁在亏钱?这场塌陷对国央企管理者、对CIO、对投资人、对正在转型的传统行业,到底意味着什么?
这一篇,我们慢慢拆。
一杯咖啡的故事:到底便宜到什么程度
先讲一个具体场景。
2026年4月26日下午,DeepSeek官方公众号发了一条不长的公告——全系API输入缓存命中价格降至首发价的十分之一。
公告里有个数字,看不懂技术的人可能会一眼划过去——
DeepSeek V4 Flash 缓存命中输入:0.02元/百万Tokens。
这是什么概念?BuilderPi给你换算一下。
一杯瑞幸咖啡,30块钱。
这30块钱,按0.02元一百万Tokens算,能买15亿个Token。
15亿个Token是多少?
中文一个字大约对应1.5个Token,15亿个Token大概等于10亿个汉字。
10亿个汉字是多少?
《红楼梦》全本约87万字。10亿字≈1149本《红楼梦》。
也就是说——
今天你花30块钱买杯咖啡的同时,可以让AI"读完"1000多本《红楼梦》,并给你一份完整的分析报告。
这是一座中型图书馆的藏书量。
我们再做一个更直观的对比。
2023年3月,GPT-4刚发布的时候,每百万输入Tokens的价格是30美元——按当时汇率约210元人民币。
也就是说,2023年的30元(约4美元)只能买到13万个Token——大约8万个汉字,不到一本《红楼梦》的十分之一。
从2023年到2026年,仅仅3年,AI的"知识阅读量价格"——
从"半本红楼梦",跌到了"1000本红楼梦"。
跌了1万倍。
BuilderPi此前在《Token定价权》一文中追踪过这个趋势的中间阶段——但即使是当时,也没有人预料到塌陷会来得这么快、这么彻底。
而这只是DeepSeek一家。
同一周,OpenRouter(全球最大的AI模型API聚合平台)的报价表显示:
• MiniMax M2.7:1.2美元/百万Tokens输出 • 阿里Qwen3.6 Plus:1.95美元/百万Tokens输出 • Kimi K2.6:4.0美元/百万Tokens输出 • 智谱GLM-5.1:4.4美元/百万Tokens输出 • DeepSeek V4 Pro限时折扣:0.87美元/百万Tokens输出
而美国那边,OpenAI的GPT-5、Anthropic的Claude Opus 4.7,输出端价格普遍在15-75美元/百万Tokens之间。
中国模型的价格,是美国对标模型的1/20到1/80。
BuilderPi的判断是——这不是简单的"价格战"。这是一场结构性的产业大塌陷。塌陷的不是某一家公司,而是整个模型层的"价格地基"。
那么问题来了——
地基都塌了,模型公司还赚得到钱吗?
塌陷正在发生:4月最后一周的四件大事
要看懂这场塌陷有多剧烈,BuilderPi带读者把2026年4月最后一周(4月21日-4月28日)发生的四件大事按时间排一遍。
这四件事,几乎是同一周内发生的——这种密集程度,在中国AI行业过去三年从未出现过。
事件一·4月21日:国务院发文支持采购大模型
这是政策面的最强信号。
国务院印发《关于推进服务业扩能提质的意见》,明确提出——
"深入实施'人工智能+'行动,加快智能编程工具研发使用,支持采购大模型、智能体服务。"
这12个字"支持采购大模型、智能体服务",BuilderPi此前已经在4月底专门写过分析。
它意味着什么?意味着国家正式把"采购大模型"放进了财政和服务业政策的工具箱——以后政府部门、国央企、事业单位的服务采购名录里,会出现"大模型API订阅"和"智能体服务"两个新条目。
这是模型层最大的需求侧信号。
事件二·4月25日:Kimi K2.6发布,Agent Swarm刷屏
月之暗面发布Kimi K2.6,一个万亿参数级的开源模型。
技术细节大多数读者不需要懂,但BuilderPi需要把一个新概念翻译给你——Agent Swarm,可以理解成"AI蜂群"。
以前的AI是一个"AI员工"在帮你干活,Agent Swarm是几百个AI小员工同时开工——你说"帮我做一个完整的电商App并部署上线",它会自动拆出几百个小任务并行处理。
杨植麟带队的Kimi,用这个能力刷爆了开发者社区。同一周,月之暗面完成20亿美元B轮融资,投后估值突破200亿美元。
事件三·4月26日:DeepSeek API价格雪崩90%
就是开篇讲的那条公告。
但这条公告还有一个细节,绝大多数报道没说清楚——降价的时机。
DeepSeek选在了Kimi K2.6发布的第二天降价。
BuilderPi看来,这是一次精准的反击。Kimi K2.6的输出价是DeepSeek V4 Pro的4.6倍,DeepSeek用一次降价把"性价比之王"的标签牢牢按在自己身上。
降价当天,OpenRouter平台上DeepSeek V4 Flash单日调用量飙升至814亿Tokens,创历史新高。
事件四·4月底:国家大基金传将入股DeepSeek
这是最重的一锤。
英国《金融时报》率先爆料——国家集成电路产业投资基金(市场俗称"大基金")正接触DeepSeek,估值据传450亿美元,比三周前传出的100亿美元估值翻了4.5倍。
虽然官方未确认,但这个传闻本身就足以引发产业震动。
为什么?因为"大基金"过去主要投半导体和芯片——它把通用大模型纳入投资范围,意味着国家正式把"大模型"和"芯片"放在了同等的战略位置。
如果传闻属实,这将是中国AI模型层公司有史以来最大单笔国资入局。
四件事并发,BuilderPi判断的产业含义是什么?
四件事看似各自独立,但拼到一起能看出一条清晰的产业逻辑链——
政策端开闸(国务院支持采购)→ 技术端竞速(Kimi K2.6、DeepSeek V4双开源)→ 价格端塌陷(DeepSeek降价90%)→ 资本端集中(国家队450亿美元)
链条的每一环都在加速另外三环。
BuilderPi此前追踪过的"Token产业链"逻辑,正在以肉眼可见的速度成型。
而最关键的问题在最后——
这条链条上,谁在赚钱?
模型公司在赚钱吗?一个反直觉的答案
先抛结论——
绝大多数模型公司,目前不仅不赚钱,还在剧烈亏钱。
这跟外界看到的"估值飙升、融资创纪录"的繁荣景象,几乎是两个世界。
BuilderPi给读者算几笔账。
收入侧:模型公司一年能赚多少?
最新可查的数据——
• 月之暗面:2026年4月年度经常性收入(ARR)约2亿美元 • MiniMax:传2025年全年收入约5亿元人民币 • 智谱AI:B端收入增速领先,但绝对规模未公开 • DeepSeek:开源模式,几乎不直接卖API赚钱(其API收入据估算每年仅数千万美元级)
什么概念?月之暗面的2亿美元ARR——是它至今最高的公开收入数据——大概等于1.4亿元人民币的月收入。
成本侧:训练一个万亿参数模型要多少钱?
BuilderPi帮读者把"训练成本"翻译成普通人能理解的话。
训练Kimi K2.6或DeepSeek V4这样的万亿参数模型,需要——
• 算力:万卡级别的GPU集群,按市价租用,仅训练一次大约5000万到1.5亿美元 • 电费:训练一次大模型耗电量相当于一个3万人小镇全年用电 • 人才:核心算法团队顶级薪酬,单家头部公司人才成本年支出超10亿人民币 • 数据:高质量语料采购、清洗、标注,单家年支出数亿人民币
把这些加起来,一家头部模型公司的年度运营成本,普遍在20-50亿人民币级别。
而收入呢?头部公司也就十几亿人民币级别。
差距是显而易见的——模型公司每年烧的钱,是赚的钱的2-5倍。
那为什么估值还在飙升?
这就是模型层最反直觉的地方。
DeepSeek传估值450亿美元、月之暗面估值200亿美元、智谱估值据传超过300亿人民币——但这些公司绝大多数还在亏损。
资本不是傻——估值逻辑跟收入脱钩,跟"未来的产业地位"挂钩。
资本赌的是什么?
赌的是这场塌陷之后,全中国能活下来的"模型国家队",可能就剩2-3家。
谁能活下来,谁就能在AGI时代卡住产业链最高位置——就像今天的中石油、中移动,是上一个时代的"国家级基础设施提供方"。
BuilderPi判断,这才是国家大基金传出450亿美元估值入股DeepSeek的真正逻辑——不是投一家公司,是投一个未来的"国家级大模型基础设施"。
一个BuilderPi的形象比喻
我们用做手机的类比来理解模型层的处境。
2010年代的中国手机行业,最热闹的是手机厂商——华为、小米、OPPO、vivo、魅族、锤子,几十家在打价格战。
但十多年过去回头看——
• 真正赚钱的是芯片厂商:高通、联发科靠卖SoC坐地收钱 • 真正赚钱的是应用生态:微信、抖音、淘宝靠手机普及收割流量 • 真正赚钱的是渠道方:运营商、苹果App Store、华为应用市场抽成
而手机厂商自己呢?除了苹果一家,几乎没有一家手机厂商靠卖手机长期实现高毛利。绝大多数都死了,活下来的也活得很辛苦。
BuilderPi看来,模型层正在重演手机行业的剧本——
• 表面最热闹(不停发布新模型、刷榜、融资) • 实际最辛苦(烧钱、价格战、生死竞速) • 真正赚钱的人在两端
这就是模型层的"加工厂宿命"。
钱被两端的人赚走了
如果说模型公司是产业链中间被挤压的"加工厂",那么钱去哪了?
BuilderPi的判断是——钱在向产业链的两端集中,上游和下游同时受益。
上游受益方:卖给模型公司的人
受益方1·国产芯片:从"配角"变"主角"
DeepSeek V4发布的同一天,华为公开宣布昇腾超节点已全面适配DeepSeek V4——20毫秒级推理时延、单卡每秒上千Tokens吞吐。
更值得关注的是,模型层国产化适配的速度。
摩尔线程披露——它的AI训推一体智算卡MTT S5000,在DeepSeek V4发布的"零日"完成核心算子适配,算子通过率超80%。
这是中国AI产业链过去几年从未达到过的协同速度。BuilderPi判断的关键点是——
头部国产芯片公司正在通过"日0适配"绑定头部模型公司,形成"中国芯+中国模型"的全栈联盟。
谁绑得最牢,谁就吃到最大的红利。
涉及公司有:华为昇腾、摩尔线程、寒武纪、海光信息——多家公司在不同路径上探索,目前格局未定。
受益方2·算力运营商:呼应BuilderPi调度篇
模型公司不停训练、推理,最终落到地面就是用电、用算力、用机柜。
BuilderPi此前在调度篇里追踪过的"算力国家电网"逻辑,在这场模型大塌陷里被进一步放大——模型越便宜,调用量越爆炸,对算力调度运营商的需求越刚性。
涉及公司有:中国移动、中国电信、中国联通等运营商;润建股份、国电南瑞等"源网荷储算"一体化运营商;协鑫能科、华润电力等绿电+算力打包销售方。
每一家都在不同位置上吃到了红利。
受益方3·语料/数据服务商:最被低估的一环
训练大模型需要海量高质量数据。
随着北京、上海等地大模型备案要求关键词库规模达到20-50万词、测试题集达到5万题——专业的数据标注、语料清洗、安全测试服务正在变成一个独立行业。
上海市政府的政策中已经明确——**1亿元的"语料券"**专项用于支持企业采购数据服务。
这是过去BuilderPi读者关注较少的环节,但正在快速崛起。
下游受益方:用模型的人
受益方1·应用公司:API成本断崖下降的最大红利方
价格雪崩90%,意味着什么?
意味着以前一个AI应用每月API成本10万元,现在只要1万元。
意味着以前不敢做的产品功能,现在可以做了。
意味着以前算账算不过来的Agent、AI助手、智能客服,现在能盈利了。
BuilderPi看来,这是中国AI应用层的"寒武纪大爆发"前夜——便宜的"AI水电"开始大规模供应,应用方终于敢"放开了用"。
受益方2·传统行业转型者:BuilderPi最关心的群体
这一群体是BuilderPi读者的核心——电力、银行、医院、IDC、城投、制造业。
国务院4月21日《关于推进服务业扩能提质的意见》明确"支持采购大模型、智能体服务"——这相当于给了这一批传统行业正式的"采购通行证"。
举几个BuilderPi此前追踪过的具体场景:
• 电力公司:用大模型做电网调度优化、客户服务、设备预测性维护 • 银行:用Agent处理对私客服、风控建模、合规审查 • 医院:用大模型辅助影像诊断、病历整理、医学文献研究 • 制造业:用模型做工艺参数优化、质量检测、供应链调度
成本降到原来的1/10,很多场景终于从"算不过账"变成了"算得过来"。
受益方3·Agent创业者:单位经济模型彻底改写
Agent(智能体)和传统AI应用最大的区别是——它要反复调用大模型几十甚至几百次才能完成一个任务。
按2025年初的价格,一个复杂Agent任务的成本可能要几块钱。这使得绝大多数Agent类创业项目单位经济模型不成立——用户付的钱不够付API费用。
价格降90%之后,单次任务成本降到几毛甚至几分钱。
Agent创业者第一次拿到了"账算得过来"的入场券。
杭州市2026年5月8日宣布"2026年推进AI从大模型走向智能体阶段"——BuilderPi看来,这背后就是成本侧的根本性松动。
受益方4·个人专业人士:被忽视的红利方
最后一个受益方,可能是受益最广但最被忽视的——个人专业人士。
律师、咨询师、会计、医生、研究员、教师——这些靠"专业知识+时间"赚钱的人,过去用AI最大的障碍是成本。
价格塌陷之后,一个律师每月花几十块钱就能让AI"读完"上百份判例;一个咨询师花一杯咖啡的钱就能让AI"读完"上千份行业报告。
这是BuilderPi读者里"个人专业人士"群体最直接的红利。
BuilderPi判断:模型层的"加工厂宿命"
走到这里,可以拎出本篇的BuilderPi判断了——
BuilderPi判断:模型公司正在变成产业链里"最热闹也最辛苦"的一环。技术再牛,价格被卷到白菜价;估值再高,本质上是在"烧钱换生存权"。这不是行业危机,是产业成熟过程中的"加工厂宿命"——真正的产业利润,正在向产业链两端转移。上游的国产芯片和算力运营商,下游的应用方和传统行业转型者,才是这场塌陷里真正的赢家。模型层最终能笑到最后的,目前看来不会超过2-3家。
为什么BuilderPi会做出这个判断?
因为这个故事,人类历史上演过不止一次。
类比一:电力行业
100多年前的美国,电力刚普及时,发电厂是最热闹的——爱迪生、特斯拉、威斯汀豪斯,几十家发电公司在打价格战。
但100年后回头看——
• 真正长期高毛利的,是上游的电气设备制造商(GE、西门子) • 真正长期高毛利的,是下游的用电大户(钢厂、化工厂、数据中心) • 发电厂自己呢?全球范围内合并到只剩几家"国家级电力公司"
类比二:钢铁行业
中国90年代有几千家钢厂,最热闹的几年大家都在喊"钢铁强国"。
但20年过去——
• 上游的铁矿石巨头(淡水河谷、力拓)赚到了大钱 • 下游的用钢大户(房地产、汽车、家电)享受了便宜钢铁的红利 • 钢厂本身?几千家合并到现在主要的几十家,多数年份毛利率个位数
类比三:手机行业(前面已展开)
模型层的剧本,正在重演这些行业的轨迹。
不同的只是——电力、钢铁、手机的塌陷过程花了几十年甚至上百年,模型层的塌陷只用了3年。
塌陷不是终点,是产业成熟的标志。
塌陷之后,行业才能真正进入"应用爆发"的阶段。
给BuilderPi读者的具体判断
模型层正在塌陷——这对不同身份的BuilderPi读者,意味着什么?
给国央企管理者:你们正在变成最大的甲方
国务院4月21日的政策已经把通道打开。
未来3年,国央企会成为中国大模型市场最大的需求方——但选哪家、怎么选、怎么用,是个新问题。
BuilderPi的具体建议——
• 不要追"最贵最强"的旗舰模型,结合自身场景选合适规模的模型(绝大多数业务场景用Flash版本就够了) • 重点看模型公司的"持续迭代能力"和"国产芯片适配度",而不是单一时点的跑分 • 关注上海"3亿模型券"、北京"双百突破"这类地方政策,可以大幅降低试错成本 • 优先选已完成大模型备案的合规模型——截至2025年底全国748款已备案,选择空间足够
给CIO/企业IT决策者:用便宜的开源模型重做IT基础设施
价格降90%最直接的影响是——很多过去用闭源SaaS的环节,现在可以换成开源大模型自部署。
• 客服系统:从SaaS年订阅几十万,换成开源模型自部署,年成本可能降到几万 • 代码助手:从GitHub Copilot等海外工具,换成国内开源代码模型 • 知识库问答:从过去的"上传文档+训练"模式,换成"开源大模型+检索增强"模式
但BuilderPi要提醒——便宜的开源模型不等于零成本。私有化部署需要算力、需要运维、需要安全审计。真实TCO(总拥有成本)需要算清楚再决策。
给投资人:换一个估值锚点
模型层的估值逻辑已经和2024年完全不同。
• 看ARR没用了——大多数模型公司ARR增速跑不过烧钱速度 • 看跑分也没用了——榜单两周变一次 • 看"国家队入局信号"才是关键——大基金、地方国资、运营商谁先入股,谁就是潜在的"剩者为王" • 看应用层和算力层的传导——模型变便宜了,谁先做出爆款应用?谁的算力先被填满?
BuilderPi看来,2026年模型层的投资逻辑,本质上变成了"押产业地位",不是"押技术领先"。
给个人专业人士:你的"知识阅读量"刚刚被解放
如果你是律师、咨询师、会计、医生、研究员、教师——
一杯咖啡的钱能让AI读完一座图书馆这件事,对你来说不是新闻,是工具革命。
具体怎么用?
• 把行业里所有公开报告/判例/论文喂给AI,让它替你做"持续追踪" • 把客户提供的几十份合同、几百份文档丢给AI做初步梳理 • 把你过去几年写过的所有报告做成"个人知识库",让AI随时帮你调取
成本几乎可以忽略不计。唯一的限制变成了"你愿不愿意用"。
给传统行业转型者:你的"AI水电"账本
电力、银行、医院、IDC、城投、制造业——这些BuilderPi最关心的群体。
价格降90%意味着——过去算不过来的"AI改造场景",现在能算过来了。
但BuilderPi要提醒一个反直觉的点——
模型变便宜,不等于AI改造成功。
真正的瓶颈从来不是模型成本,是——
• 数据治理:业务数据是否结构化、是否能调用 • 业务流程改造:AI是否能真的嵌入到现有工作流 • 人才培养:现有团队是否会用、敢用、能用好AI
BuilderPi看来——模型便宜,恰恰把"内功"问题暴露得更彻底了。模型成本不再是借口,剩下的全是组织能力问题。
给Agent创业者:你的"账本"刚刚改写
Agent类创业者过去最大的痛点——单位经济模型不成立。
价格降90%之后,账本被彻底改写。
杭州2026年5月8日宣布的"从大模型走向智能体"政策方向,给了Agent创业者政策面+成本面双重加持。
但BuilderPi要提醒——
Agent的护城河不在模型,在场景理解和数据闭环。
便宜的模型API人人能调用,但你能比别人更懂某个垂直行业、能比别人更快积累场景数据,这才是核心竞争力。
从一度电到一杯咖啡
回到开篇那杯咖啡。
《电的二次出海》系列追踪到第8篇,我们终于看到了一条完整的因果链——
西部的一度电 → 中部的一台服务器 → 东部的一个词元 → 全世界的一杯咖啡
电的二次出海,本质上是把中国丰富的电力,通过模型层这个"加工厂",变成全世界都买得起、用得起的智能服务。
模型层的塌陷不是危机,是产业成熟的标志。
下一篇·出海篇,BuilderPi将带读者去看——这些便宜到不可思议的中国词元,是怎么真正走出国门、走向全世界的。
每一杯被AI"读懂"的咖啡背后,都是中国西部的一度电、中部的一台服务器、东部的一根海缆。
电的二次出海,已经走到下半场。
本文不构成任何投资建议。市场有风险,决策需审慎。
《电的二次出海》系列·第二序章·08·模型篇
BuilderPi出品 · 持续追踪中国"电变词元"产业链
下期预告:第二序章·09·出海篇——中国词元的全球分发
夜雨聆风