一杯咖啡,AI读完一座图书馆|电的二次出海·模型篇

一杯咖啡，AI读完一座图书馆｜电的二次出海·模型篇

写在前面：从电到词元，到一杯咖啡

《电的二次出海》系列已经走了七篇。

第一序章四篇，BuilderPi带读者把中国"电变词元"的产业地理跑了一遍——西部生产、中部调度、东部出海。

第二序章已经写完三篇——能源篇讲"电从哪来"，基建篇讲"电怎么传"，算力篇讲"电怎么变成算力"。

到这一篇，我们终于要回答整个系列里最关键也最反直觉的那个问题——

算力变成什么，卖给全世界？

答案是词元（Token）。

如果说能源、基建、算力是产业链的"前段工厂"，那模型层就是真正的"加工车间"——把电变成词元，再把词元打包卖给应用、卖给企业、卖给全世界的开发者。

但2026年4月最后一周开始，这个加工车间，正在经历一场前所未有的塌陷。

塌陷有多剧烈？

一杯咖啡的钱，今天能买的AI算力，相当于让AI"读完"一整座图书馆。

这不是夸张，是BuilderPi算过账的真实数字。

而BuilderPi最关心的问题是——当模型变得这么便宜，到底是谁在赚钱？谁在亏钱？这场塌陷对国央企管理者、对CIO、对投资人、对正在转型的传统行业，到底意味着什么？

这一篇，我们慢慢拆。

一杯咖啡的故事：到底便宜到什么程度

先讲一个具体场景。

2026年4月26日下午，DeepSeek官方公众号发了一条不长的公告——全系API输入缓存命中价格降至首发价的十分之一。

公告里有个数字，看不懂技术的人可能会一眼划过去——

DeepSeek V4 Flash 缓存命中输入：0.02元/百万Tokens。

这是什么概念？BuilderPi给你换算一下。

一杯瑞幸咖啡，30块钱。

这30块钱，按0.02元一百万Tokens算，能买15亿个Token。

15亿个Token是多少？

中文一个字大约对应1.5个Token，15亿个Token大概等于10亿个汉字。

10亿个汉字是多少？

《红楼梦》全本约87万字。10亿字≈1149本《红楼梦》。

也就是说——

今天你花30块钱买杯咖啡的同时，可以让AI"读完"1000多本《红楼梦》，并给你一份完整的分析报告。

这是一座中型图书馆的藏书量。

我们再做一个更直观的对比。

2023年3月，GPT-4刚发布的时候，每百万输入Tokens的价格是30美元——按当时汇率约210元人民币。

也就是说，2023年的30元（约4美元）只能买到13万个Token——大约8万个汉字，不到一本《红楼梦》的十分之一。

从2023年到2026年，仅仅3年，AI的"知识阅读量价格"——

从"半本红楼梦"，跌到了"1000本红楼梦"。

跌了1万倍。

BuilderPi此前在《Token定价权》一文中追踪过这个趋势的中间阶段——但即使是当时，也没有人预料到塌陷会来得这么快、这么彻底。

而这只是DeepSeek一家。

同一周，OpenRouter（全球最大的AI模型API聚合平台）的报价表显示：

• MiniMax M2.7：1.2美元/百万Tokens输出
• 阿里Qwen3.6 Plus：1.95美元/百万Tokens输出
• Kimi K2.6：4.0美元/百万Tokens输出
• 智谱GLM-5.1：4.4美元/百万Tokens输出
• DeepSeek V4 Pro限时折扣：0.87美元/百万Tokens输出

而美国那边，OpenAI的GPT-5、Anthropic的Claude Opus 4.7，输出端价格普遍在15-75美元/百万Tokens之间。

中国模型的价格，是美国对标模型的1/20到1/80。

BuilderPi的判断是——这不是简单的"价格战"。这是一场结构性的产业大塌陷。塌陷的不是某一家公司，而是整个模型层的"价格地基"。

那么问题来了——

地基都塌了，模型公司还赚得到钱吗？

塌陷正在发生：4月最后一周的四件大事

要看懂这场塌陷有多剧烈，BuilderPi带读者把2026年4月最后一周（4月21日-4月28日）发生的四件大事按时间排一遍。

这四件事，几乎是同一周内发生的——这种密集程度，在中国AI行业过去三年从未出现过。

事件一·4月21日：国务院发文支持采购大模型

这是政策面的最强信号。

国务院印发《关于推进服务业扩能提质的意见》，明确提出——

"深入实施'人工智能+'行动，加快智能编程工具研发使用，支持采购大模型、智能体服务。"

这12个字"支持采购大模型、智能体服务"，BuilderPi此前已经在4月底专门写过分析。

它意味着什么？意味着国家正式把"采购大模型"放进了财政和服务业政策的工具箱——以后政府部门、国央企、事业单位的服务采购名录里，会出现"大模型API订阅"和"智能体服务"两个新条目。

这是模型层最大的需求侧信号。

事件二·4月25日：Kimi K2.6发布，Agent Swarm刷屏

月之暗面发布Kimi K2.6，一个万亿参数级的开源模型。

技术细节大多数读者不需要懂，但BuilderPi需要把一个新概念翻译给你——Agent Swarm，可以理解成"AI蜂群"。

以前的AI是一个"AI员工"在帮你干活，Agent Swarm是几百个AI小员工同时开工——你说"帮我做一个完整的电商App并部署上线"，它会自动拆出几百个小任务并行处理。

杨植麟带队的Kimi，用这个能力刷爆了开发者社区。同一周，月之暗面完成20亿美元B轮融资，投后估值突破200亿美元。

事件三·4月26日：DeepSeek API价格雪崩90%

就是开篇讲的那条公告。

但这条公告还有一个细节，绝大多数报道没说清楚——降价的时机。

DeepSeek选在了Kimi K2.6发布的第二天降价。

BuilderPi看来，这是一次精准的反击。Kimi K2.6的输出价是DeepSeek V4 Pro的4.6倍，DeepSeek用一次降价把"性价比之王"的标签牢牢按在自己身上。

降价当天，OpenRouter平台上DeepSeek V4 Flash单日调用量飙升至814亿Tokens，创历史新高。

事件四·4月底：国家大基金传将入股DeepSeek

这是最重的一锤。

英国《金融时报》率先爆料——国家集成电路产业投资基金（市场俗称"大基金"）正接触DeepSeek，估值据传450亿美元，比三周前传出的100亿美元估值翻了4.5倍。

虽然官方未确认，但这个传闻本身就足以引发产业震动。

为什么？因为"大基金"过去主要投半导体和芯片——它把通用大模型纳入投资范围，意味着国家正式把"大模型"和"芯片"放在了同等的战略位置。

如果传闻属实，这将是中国AI模型层公司有史以来最大单笔国资入局。

四件事并发，BuilderPi判断的产业含义是什么？

四件事看似各自独立，但拼到一起能看出一条清晰的产业逻辑链——

政策端开闸（国务院支持采购）→ 技术端竞速（Kimi K2.6、DeepSeek V4双开源）→ 价格端塌陷（DeepSeek降价90%）→ 资本端集中（国家队450亿美元）

链条的每一环都在加速另外三环。

BuilderPi此前追踪过的"Token产业链"逻辑，正在以肉眼可见的速度成型。

而最关键的问题在最后——

这条链条上，谁在赚钱？

模型公司在赚钱吗？一个反直觉的答案

先抛结论——

绝大多数模型公司，目前不仅不赚钱，还在剧烈亏钱。

这跟外界看到的"估值飙升、融资创纪录"的繁荣景象，几乎是两个世界。

BuilderPi给读者算几笔账。

收入侧：模型公司一年能赚多少？

最新可查的数据——

• 月之暗面：2026年4月年度经常性收入（ARR）约2亿美元
• MiniMax：传2025年全年收入约5亿元人民币
• 智谱AI：B端收入增速领先，但绝对规模未公开
• DeepSeek：开源模式，几乎不直接卖API赚钱（其API收入据估算每年仅数千万美元级）

什么概念？月之暗面的2亿美元ARR——是它至今最高的公开收入数据——大概等于1.4亿元人民币的月收入。

成本侧：训练一个万亿参数模型要多少钱？

BuilderPi帮读者把"训练成本"翻译成普通人能理解的话。

训练Kimi K2.6或DeepSeek V4这样的万亿参数模型，需要——

• 算力：万卡级别的GPU集群，按市价租用，仅训练一次大约5000万到1.5亿美元
• 电费：训练一次大模型耗电量相当于一个3万人小镇全年用电
• 人才：核心算法团队顶级薪酬，单家头部公司人才成本年支出超10亿人民币
• 数据：高质量语料采购、清洗、标注，单家年支出数亿人民币

把这些加起来，一家头部模型公司的年度运营成本，普遍在20-50亿人民币级别。

而收入呢？头部公司也就十几亿人民币级别。

差距是显而易见的——模型公司每年烧的钱，是赚的钱的2-5倍。

那为什么估值还在飙升？

这就是模型层最反直觉的地方。

DeepSeek传估值450亿美元、月之暗面估值200亿美元、智谱估值据传超过300亿人民币——但这些公司绝大多数还在亏损。

资本不是傻——估值逻辑跟收入脱钩，跟"未来的产业地位"挂钩。

资本赌的是什么？

赌的是这场塌陷之后，全中国能活下来的"模型国家队"，可能就剩2-3家。

谁能活下来，谁就能在AGI时代卡住产业链最高位置——就像今天的中石油、中移动，是上一个时代的"国家级基础设施提供方"。

BuilderPi判断，这才是国家大基金传出450亿美元估值入股DeepSeek的真正逻辑——不是投一家公司，是投一个未来的"国家级大模型基础设施"。

一个BuilderPi的形象比喻

我们用做手机的类比来理解模型层的处境。

2010年代的中国手机行业，最热闹的是手机厂商——华为、小米、OPPO、vivo、魅族、锤子，几十家在打价格战。

但十多年过去回头看——

• 真正赚钱的是芯片厂商：高通、联发科靠卖SoC坐地收钱
• 真正赚钱的是应用生态：微信、抖音、淘宝靠手机普及收割流量
• 真正赚钱的是渠道方：运营商、苹果App Store、华为应用市场抽成

而手机厂商自己呢？除了苹果一家，几乎没有一家手机厂商靠卖手机长期实现高毛利。绝大多数都死了，活下来的也活得很辛苦。

BuilderPi看来，模型层正在重演手机行业的剧本——

• 表面最热闹（不停发布新模型、刷榜、融资）
• 实际最辛苦（烧钱、价格战、生死竞速）
• 真正赚钱的人在两端

这就是模型层的"加工厂宿命"。

钱被两端的人赚走了

如果说模型公司是产业链中间被挤压的"加工厂"，那么钱去哪了？

BuilderPi的判断是——钱在向产业链的两端集中，上游和下游同时受益。

上游受益方：卖给模型公司的人

受益方1·国产芯片：从"配角"变"主角"

DeepSeek V4发布的同一天，华为公开宣布昇腾超节点已全面适配DeepSeek V4——20毫秒级推理时延、单卡每秒上千Tokens吞吐。

更值得关注的是，模型层国产化适配的速度。

摩尔线程披露——它的AI训推一体智算卡MTT S5000，在DeepSeek V4发布的"零日"完成核心算子适配，算子通过率超80%。

这是中国AI产业链过去几年从未达到过的协同速度。BuilderPi判断的关键点是——

头部国产芯片公司正在通过"日0适配"绑定头部模型公司，形成"中国芯+中国模型"的全栈联盟。

谁绑得最牢，谁就吃到最大的红利。

涉及公司有：华为昇腾、摩尔线程、寒武纪、海光信息——多家公司在不同路径上探索，目前格局未定。

受益方2·算力运营商：呼应BuilderPi调度篇

模型公司不停训练、推理，最终落到地面就是用电、用算力、用机柜。

BuilderPi此前在调度篇里追踪过的"算力国家电网"逻辑，在这场模型大塌陷里被进一步放大——模型越便宜，调用量越爆炸，对算力调度运营商的需求越刚性。

涉及公司有：中国移动、中国电信、中国联通等运营商；润建股份、国电南瑞等"源网荷储算"一体化运营商；协鑫能科、华润电力等绿电+算力打包销售方。

每一家都在不同位置上吃到了红利。

受益方3·语料/数据服务商：最被低估的一环

训练大模型需要海量高质量数据。

随着北京、上海等地大模型备案要求关键词库规模达到20-50万词、测试题集达到5万题——专业的数据标注、语料清洗、安全测试服务正在变成一个独立行业。

上海市政府的政策中已经明确——**1亿元的"语料券"**专项用于支持企业采购数据服务。

这是过去BuilderPi读者关注较少的环节，但正在快速崛起。

下游受益方：用模型的人

受益方1·应用公司：API成本断崖下降的最大红利方

价格雪崩90%，意味着什么？

意味着以前一个AI应用每月API成本10万元，现在只要1万元。

意味着以前不敢做的产品功能，现在可以做了。

意味着以前算账算不过来的Agent、AI助手、智能客服，现在能盈利了。

BuilderPi看来，这是中国AI应用层的"寒武纪大爆发"前夜——便宜的"AI水电"开始大规模供应，应用方终于敢"放开了用"。

受益方2·传统行业转型者：BuilderPi最关心的群体

这一群体是BuilderPi读者的核心——电力、银行、医院、IDC、城投、制造业。

国务院4月21日《关于推进服务业扩能提质的意见》明确"支持采购大模型、智能体服务"——这相当于给了这一批传统行业正式的"采购通行证"。

举几个BuilderPi此前追踪过的具体场景：

• 电力公司：用大模型做电网调度优化、客户服务、设备预测性维护
• 银行：用Agent处理对私客服、风控建模、合规审查
• 医院：用大模型辅助影像诊断、病历整理、医学文献研究
• 制造业：用模型做工艺参数优化、质量检测、供应链调度

成本降到原来的1/10，很多场景终于从"算不过账"变成了"算得过来"。

受益方3·Agent创业者：单位经济模型彻底改写

Agent（智能体）和传统AI应用最大的区别是——它要反复调用大模型几十甚至几百次才能完成一个任务。

按2025年初的价格，一个复杂Agent任务的成本可能要几块钱。这使得绝大多数Agent类创业项目单位经济模型不成立——用户付的钱不够付API费用。

价格降90%之后，单次任务成本降到几毛甚至几分钱。

Agent创业者第一次拿到了"账算得过来"的入场券。

杭州市2026年5月8日宣布"2026年推进AI从大模型走向智能体阶段"——BuilderPi看来，这背后就是成本侧的根本性松动。

受益方4·个人专业人士：被忽视的红利方

最后一个受益方，可能是受益最广但最被忽视的——个人专业人士。

律师、咨询师、会计、医生、研究员、教师——这些靠"专业知识+时间"赚钱的人，过去用AI最大的障碍是成本。

价格塌陷之后，一个律师每月花几十块钱就能让AI"读完"上百份判例；一个咨询师花一杯咖啡的钱就能让AI"读完"上千份行业报告。

这是BuilderPi读者里"个人专业人士"群体最直接的红利。

BuilderPi判断：模型层的"加工厂宿命"

走到这里，可以拎出本篇的BuilderPi判断了——

BuilderPi判断：模型公司正在变成产业链里"最热闹也最辛苦"的一环。技术再牛，价格被卷到白菜价；估值再高，本质上是在"烧钱换生存权"。这不是行业危机，是产业成熟过程中的"加工厂宿命"——真正的产业利润，正在向产业链两端转移。上游的国产芯片和算力运营商，下游的应用方和传统行业转型者，才是这场塌陷里真正的赢家。模型层最终能笑到最后的，目前看来不会超过2-3家。

为什么BuilderPi会做出这个判断？

因为这个故事，人类历史上演过不止一次。

类比一：电力行业

100多年前的美国，电力刚普及时，发电厂是最热闹的——爱迪生、特斯拉、威斯汀豪斯，几十家发电公司在打价格战。

但100年后回头看——

• 真正长期高毛利的，是上游的电气设备制造商（GE、西门子）
• 真正长期高毛利的，是下游的用电大户（钢厂、化工厂、数据中心）
• 发电厂自己呢？全球范围内合并到只剩几家"国家级电力公司"

类比二：钢铁行业

中国90年代有几千家钢厂，最热闹的几年大家都在喊"钢铁强国"。

但20年过去——

• 上游的铁矿石巨头（淡水河谷、力拓）赚到了大钱
• 下游的用钢大户（房地产、汽车、家电）享受了便宜钢铁的红利
• 钢厂本身？几千家合并到现在主要的几十家，多数年份毛利率个位数

类比三：手机行业（前面已展开）

模型层的剧本，正在重演这些行业的轨迹。

不同的只是——电力、钢铁、手机的塌陷过程花了几十年甚至上百年，模型层的塌陷只用了3年。

塌陷不是终点，是产业成熟的标志。

塌陷之后，行业才能真正进入"应用爆发"的阶段。

给BuilderPi读者的具体判断

模型层正在塌陷——这对不同身份的BuilderPi读者，意味着什么？

给国央企管理者：你们正在变成最大的甲方

国务院4月21日的政策已经把通道打开。

未来3年，国央企会成为中国大模型市场最大的需求方——但选哪家、怎么选、怎么用，是个新问题。

BuilderPi的具体建议——

• 不要追"最贵最强"的旗舰模型，结合自身场景选合适规模的模型（绝大多数业务场景用Flash版本就够了）
• 重点看模型公司的"持续迭代能力"和"国产芯片适配度"，而不是单一时点的跑分
• 关注上海"3亿模型券"、北京"双百突破"这类地方政策，可以大幅降低试错成本
• 优先选已完成大模型备案的合规模型——截至2025年底全国748款已备案，选择空间足够

给CIO/企业IT决策者：用便宜的开源模型重做IT基础设施

价格降90%最直接的影响是——很多过去用闭源SaaS的环节，现在可以换成开源大模型自部署。

• 客服系统：从SaaS年订阅几十万，换成开源模型自部署，年成本可能降到几万
• 代码助手：从GitHub Copilot等海外工具，换成国内开源代码模型
• 知识库问答：从过去的"上传文档+训练"模式，换成"开源大模型+检索增强"模式

但BuilderPi要提醒——便宜的开源模型不等于零成本。私有化部署需要算力、需要运维、需要安全审计。真实TCO（总拥有成本）需要算清楚再决策。

给投资人：换一个估值锚点

模型层的估值逻辑已经和2024年完全不同。

• 看ARR没用了——大多数模型公司ARR增速跑不过烧钱速度
• 看跑分也没用了——榜单两周变一次
• 看"国家队入局信号"才是关键——大基金、地方国资、运营商谁先入股，谁就是潜在的"剩者为王"
• 看应用层和算力层的传导——模型变便宜了，谁先做出爆款应用？谁的算力先被填满？

BuilderPi看来，2026年模型层的投资逻辑，本质上变成了"押产业地位"，不是"押技术领先"。

给个人专业人士：你的"知识阅读量"刚刚被解放

如果你是律师、咨询师、会计、医生、研究员、教师——

一杯咖啡的钱能让AI读完一座图书馆这件事，对你来说不是新闻，是工具革命。

具体怎么用？

• 把行业里所有公开报告/判例/论文喂给AI，让它替你做"持续追踪"
• 把客户提供的几十份合同、几百份文档丢给AI做初步梳理
• 把你过去几年写过的所有报告做成"个人知识库"，让AI随时帮你调取

成本几乎可以忽略不计。唯一的限制变成了"你愿不愿意用"。

给传统行业转型者：你的"AI水电"账本

电力、银行、医院、IDC、城投、制造业——这些BuilderPi最关心的群体。

价格降90%意味着——过去算不过来的"AI改造场景"，现在能算过来了。

但BuilderPi要提醒一个反直觉的点——

模型变便宜，不等于AI改造成功。

真正的瓶颈从来不是模型成本，是——

• 数据治理：业务数据是否结构化、是否能调用
• 业务流程改造：AI是否能真的嵌入到现有工作流
• 人才培养：现有团队是否会用、敢用、能用好AI

BuilderPi看来——模型便宜，恰恰把"内功"问题暴露得更彻底了。模型成本不再是借口，剩下的全是组织能力问题。

给Agent创业者：你的"账本"刚刚改写

Agent类创业者过去最大的痛点——单位经济模型不成立。

价格降90%之后，账本被彻底改写。

杭州2026年5月8日宣布的"从大模型走向智能体"政策方向，给了Agent创业者政策面+成本面双重加持。

但BuilderPi要提醒——

Agent的护城河不在模型，在场景理解和数据闭环。

便宜的模型API人人能调用，但你能比别人更懂某个垂直行业、能比别人更快积累场景数据，这才是核心竞争力。

从一度电到一杯咖啡

回到开篇那杯咖啡。

《电的二次出海》系列追踪到第8篇，我们终于看到了一条完整的因果链——

西部的一度电 → 中部的一台服务器 → 东部的一个词元 → 全世界的一杯咖啡

电的二次出海，本质上是把中国丰富的电力，通过模型层这个"加工厂"，变成全世界都买得起、用得起的智能服务。

模型层的塌陷不是危机，是产业成熟的标志。

下一篇·出海篇，BuilderPi将带读者去看——这些便宜到不可思议的中国词元，是怎么真正走出国门、走向全世界的。

每一杯被AI"读懂"的咖啡背后，都是中国西部的一度电、中部的一台服务器、东部的一根海缆。

电的二次出海，已经走到下半场。

本文不构成任何投资建议。市场有风险，决策需审慎。

《电的二次出海》系列·第二序章·08·模型篇
BuilderPi出品 · 持续追踪中国"电变词元"产业链
下期预告：第二序章·09·出海篇——中国词元的全球分发