经济学正在被 AI 打回原形
1987 年,经济学家 Robert Solow 留下一句名言:"你到处都能看到计算机时代,除了在生产力统计数据里。"三十多年后,同样的剧本正在 AI 身上重演。只是这一次,问题严重得多。
SemiAnalysis 最新发布的深度报告《AI Dark Output》提出了一个核心概念:暗输出(Dark Output)——AI 创造的经济价值真实存在,但 GDP、物价指数、就业统计等宏观经济数据完全看不见它。
这不仅仅是统计偏差。当 AI 产出可能成为经济活动的主体部分时,宏观经济数据会给出完全错误的信号——看起来像衰退,实际上在爆发式增长。
什么是"暗输出"?
SemiAnalysis 将暗输出分为两类:
替代型暗输出(Substitution Dark Output):以前由人做、现在由 AI 做的工作。SemiAnalysis 的 Dark Output Monitor 识别出约 1.5 万亿美元 的任务在当前 AI 能力范围内可以被大幅增强或自动化。
新增型暗输出(New Dark Output):以前根本没人做的工作——因为太贵了,直到 AI 把它变得足够便宜。长期来看,这一类的规模可能远超替代型。
两类暗输出的共同点:价值真实存在,但统计系统看不见。

一份遗嘱的价格:从 400 美元到 0.5 美元
报告中最具冲击力的案例是法律文件起草。
一份简单遗嘱的价格在过去三十年从 400 美元降到 150 美元,年均降幅不到 5%。但 AI 介入后,从 150 美元降到 0.5 美元——一年内 99.7% 的降幅。
在 GDP 统计中,法律服务的"数量"不是通过实际产出来衡量的,而是通过律师的收费和调查问卷反推的。当 AI 接手最简单的法律文件,律师的收费单消失了,只剩下几美分的 token 成本。统计人员调查律师时,发现"平均价格"反而上涨了——因为最简单的案子都被 AI 做了,剩下的都是高收费的复杂案件。
结果是:GDP 记录为法律服务产出下降、价格上涨——而实际上,同样的事情被更便宜地完成了。

为什么螺丝钉可以,法律文书不行?
工业革命时期的统计学家能数清螺丝钉。过去六个世纪,螺丝的实际价格下降了 99% 以上,但全球产量增长了 100 亿倍。GDP 正确地将这记录为增长和生产力提升。
但服务业没有"单位"。没有"法律服务吨"、"文献综述桶"、"咨询顾问桶"。GDP 统计服务业产出时,只能看收据、工资和抽样调查的价格。当 AI 让价格暴跌时,统计系统看到的不是生产力提升,而是产出下降。

报告引用了 SemiAnalysis 的对比数据:从 15 世纪的羊皮纸抄写员(约 2000 美元),到 20 世纪初的公证人(约 1500 美元),到 1990 年的律师(约 1200 美元),到 2010 年的 LegalZoom(约 200 美元),再到 2026 年前沿模型的 API 成本(约 0.5 美元)——成本曲线不是线性下降,而是垂直坠落。
三个让统计系统崩溃的机制
边界转移(Boundary Shift):以前在市场购买的服务(比如付费研究报告),变成了内部 AI 工作流。价值还在,但交易消失了。
价格崩塌(Price Collapse):没有独立的数量和质量衡量标准。当收据减少(因为价格跌了)、平均工资上涨(因为低薪员工被替代),统计系统会解读为通胀上升、产出下降——恰恰与事实相反。
行业错配(Sector Misrouting):医院用 AI 加速文书处理,但 AI 的账单出现在科技公司(NAICS 5415)的营收里,而不是医疗行业(NAICS 6211)的产出里。GDP 分行业统计会把 AI 供应商当成价值来源,而采用 AI 的行业看起来停滞不前。

就业的诡异信号:没人涨薪,但工资涨了
AI 评论中一个常见观察是:初级员工最先被替代。这导致一个反直觉的统计现象——被替代行业的人均工资反而上涨了,因为最低薪的工人从样本中消失了。
SemiAnalysis 的数据显示,AI 暴露度最高的行业就业率在下降,但同期的相对工资却在上升。这种就业与工资的错配,正是暗输出存在的一个指纹。

1.5 万亿美元:是暴露的劳动,不是消失的产出
SemiAnalysis 的 1.5 万亿美元估值基于一个"证据阶梯":
- • Tier 1-2:基准测试表明模型能完成任务
- • Tier 3:公司声称产品能做这项工作
- • Tier 4:公司确认工具已在生产中使用
- • Tier 5:法庭成功辩护 AI 完成的工作
- • Tier 6:保险公司承保 AI 工作风险(第三方为失败定价)
1.5 万亿美元对应 Tier 4 及以上的证据。报告特别强调:这不是说 1.5 万亿的劳动已经消失,而是说这些任务在当前 AI 能力范围内有可信的替代潜力。
目前收集到的绝大多数证据指向 AI 增强(augmentation),而非 AI 替代(replacement)。

新增暗输出:看不见的增长引擎
最有趣的部分是新增暗输出。当文献综述的成本从 2000 美元降到 2 美元,人们不会做同样数量的文献综述然后把钱省下来——他们会在每个项目前都做一次文献综述。
整理过去六个月的邮件主题、面试前做学术文献检索、为会议准备对方背景报告——这些在几年前根本不值得做,现在花几分钱几分钟就能完成。价值真实存在,但经济统计中只留下 token 消耗的痕迹。
Anthropic 的经济指数显示,37% 的 token 用在计算机和数学领域,但软件投资的 GDP 贡献并未突破其 AI 之前的趋势线——甚至不是历史最高点。大量 token 消耗没有对应到可测量的经济产出。

一个被忽略的历史先例:女性主义经济学
报告在附录中做了一个发人深省的类比。1988 年,Marilyn Waring 指出,起草国民账户体系的委员会 91.7% 是男性。一句脚注将女性的大部分经济贡献——育儿、持家、照顾老人和病人——定性为"对国民账户不重要"。
国际劳工组织估计,全球每天 164 亿小时的无偿照护工作,价值 11 万亿美元,是全球科技行业收入的三倍。但在国民账户的惯例中,这一切价值为零。
经济学家 Margaret Reid 在 1934 年提出的测试至今仍是最犀利的诊断:如果一项工作可以外包给付费的第三方,它就是生产性的。 当家庭雇佣管家时,管家服务进入 GDP;当家庭成员做同样的工作时,它不进入。行为完全相同,区别只在于是否发生了金钱交易。
AI 让几乎所有的信息工作都变得可外包。一个 LLM 可以起草法律文件、分析财务报表、写营销方案、分诊患者投诉、生成代码、撰写研究摘要。在每种情况下,这些工作以前都由付费人类完成并被计入 GDP。
现在,同样的工作由 AI 完成,唯一的痕迹是 AI 公司账单上的一行。我们正用同一把 GDP 尺子,丈量一个越来越大的"暗输出"经济体。
为什么这很重要
宏观经济数据是我们观察经济的最佳窗口。投资者用它判断繁荣是否真实,政策制定者用它权衡失业与通胀,企业用它决定招聘、自动化还是扩张。
如果 AI 打破了劳动力、产出、价格和行业之间的数据关联,所有决策都会变差。数据中心、GPU、电力、水和 token 消耗——成本端清晰可见。但 token 支出代表的是真实的经济产出,还是企业在玩新玩具?这个问题的答案决定了我们是否正站在一个泡沫之上。
SemiAnalysis 的结论很明确:暗输出不是否认 AI 成本的理由,而是呼吁去衡量账本另一面的努力。 就业替代、电力需求、水资源和土地使用——这些现在就能看到。Token 消耗也能看到。但产出更难看到。
便宜的螺丝钉变成了可计数的产出。便宜的 AI 工作可能不会。
如果 AI 正在创造一个工业革命规模的事件,我们需要能看到它产出——而不仅仅是它替代了什么——的经济数据。
参考
https://newsletter.semianalysis.com/p/ai-dark-output-the-visible-cost-of
夜雨聆风