我们过去习惯把 AI 看成互联网。可能是因为做AI的人很多之前就是做互联网。
但越来越看,当前 AI 的商业底层其实更像制造业。
传统互联网的核心逻辑是:写一次代码,复制无数次,边际成本接近 0。在代码背后是不断增长的流量,通过流量变现。
但大模型不是这样。
大模型公司要买 GPU、建数据中心、消耗电力、训练模型、部署推理系统,然后持续生产 token。它不是简单复制一套软件,而是在用工业系统持续生产一种新商品:智能。
NVIDIA CEO 黄仁勋 有一个很形象的说法:未来的数据中心不是 data center,而是 AI factory。传统数据中心存储数据,AI factory 则输入能源,产出 token。
这句话非常关键。
它意味着当前AI 的生意底层不是传统 互联网,用户规模,用户数据,用户习惯的意义有限,而是一个“用能源和芯片生产智能”的工业系统。
所以今天的大模型竞争,本质上不是几个互联网公司在比谁的产品体验更好,用户规模更大,停留时间更长,这都是互联网时代的北极星指标了,而是几个超级工业系统在比:谁有更多 GPU,谁有更便宜的电力,谁有更强的数据中心调度能力,谁的智能密度更高,谁能把单位 token 成本压得更低。
这就是制造业逻辑。
前端拼资本开支,后端拼单位成本。
前沿能力拼研发投入,普及能力拼规模效率。
Sam Altman 也从另一个角度表达过类似判断。他在《Three Observations》里说,模型智能大致取决于训练算力、数据和推理算力;同等智能水平的使用成本大约每 12 个月下降 10 倍。
这说明 AI 会同时出现两个趋势:
一边,前沿模型越来越贵,因为大家要持续建设更大的算力基础设施。
另一边,普通智能越来越便宜,因为推理成本、模型压缩、硬件效率都在快速优化。
这很像钢铁、汽车、芯片、光伏、电池这些行业。
早期有技术溢价,但一旦工艺成熟、产能扩张、供应链完善,价格就会被迅速打下来。
这里还有一个很重要的机制:蒸馏。
所谓蒸馏,就是用更强大的大模型生成高质量输出,再用这些输出训练更小、更便宜的模型,让小模型在特定任务上接近大模型表现。OpenAI 官方也把 model distillation 描述为:用前沿模型的输出,去提升更低成本模型的表现。
蒸馏的商业意义是:大模型花巨资探索出来的能力,会被更小、更便宜、更专用的模型快速吸收。

这就像制造业里的工艺扩散。
第一家工厂花大钱做研发,后来者通过学习、压缩、改造供应链,把同样的能力做得更便宜。
这也是为什么模型层的高附加值会变得越来越难。
如果一个公司只是在卖“更聪明一点的 token”,长期一定会面临压力。因为客户可以换模型,开源模型会追赶,小模型可以蒸馏,推理成本会下降。
但这不意味着 AI 没有高附加值。
真正的高附加值,会从模型本身迁移到场景里。
谁有私有数据,谁有业务流程,谁有分发入口,谁能对业务结果负责,谁就还能获得高附加值。
比如在品牌广告里,真正有价值的不是“生成一段广告文案”,而是把 AI 嵌入完整增长流程:
从人群洞察,到卖点提炼,到创意生成,到素材版本化,到投放测试,到数据复盘,再到下一轮创意迭代。
这才是 AI 在商业场景里的真正形态。
不是一个聊天框。 而是一条智能生产线。
所以,关于“AI 是制造业”,我会总结成三句话:
第一,AI 的底层是制造业:用资本、能源、芯片和数据中心生产智能。
第二,蒸馏会让模型能力快速扩散,使通用智能 token 越来越商品化。
第三,高附加值不会消失,但会从模型迁移到数据、流程、分发和结果闭环。
真正值得做的,不是再造一个基础模型。
而是找到一个高价值场景,把越来越便宜的智能,变成越来越确定的业务结果。
夜雨聆风