AKASHA · ISSUE 012
1/N
AI 悄悄进入下半场
你用的工具未必笑到最后
上半场拼参数,下半场拼每参数能跑多远
2026.05.13
AI 悄悄进入下半场,你今天用的工具未必笑到最后
AKASHA · 2026.05.13
这一周,三件几乎同向的事悄悄发生——一家年轻实验室号称把超长上下文的算力压缩了约 1000 倍;一家头部研究院在顶会上发表了一个新的 KV-cache 压缩算法;多家开源旗舰把"参数最大"换成了"每参数效率最高"作为新发布的卖点。没人挂出大字海报,但 AI 行业的胜利标准,已经在被悄悄换掉。
一、桌首的人,正在被悄悄换掉
过去三年,AI 行业的"桌首"位置——也就是被同行公认走在最前面的位置——一直属于同一类人:训得最大、参数最多、卡最齐。每隔几个月就有一个新数字被刷新,叙事都是"我们到了下一档"。
但桌首的人正在悄悄被换。这一次,不是被另一个更大的模型挤下去——是被一种新的衡量标准换下去。
上一轮的标准
"在 X 基准上比上一代好几分"。规则简单——绝对性能。
这一轮的标准
"同样的能力用了多少算力、多少内存、多少美金"。规则变了——单位成本性能。
行业感知比新闻晚一拍
大众视野里还在围观"谁又发了千亿模型",而行业内部已经默默把效率指标抬到了和能力指标同一级。等大众反应过来,桌首的人已经换了一茬。
"更大" 是上一轮的胜利。"更省" 是这一轮的。
二、被忽略的三组同向信号
没人挂出"我们换路线了"的横幅。但只要把过去一周三件事并排放——
— 三 组 同 向 信 号 —
一周内发生
SIGNAL 01
新架构号称千倍效率
12M 上下文上算力压缩 ~1000× · 独立验证未完成
SIGNAL 02
顶会论文压 KV-cache
头部研究院两步法:向量旋转 + 投影压缩
SIGNAL 03
开源旗舰换口径
"参数最大" → "每参数效率最高"
"不是孤例,是同一周三家不约而同的转向。"
三件事的体量不一样、严谨程度不一样、能否独立验证也不一样——但放在一起,是同一种"风向"的多个截面。同向的细节出现得越多,就越不是巧合。
三、为什么是现在
"效率"这个词以前一直在 AI 圈飘——为什么直到现在才被推到桌首?三个边界同时变硬了。
物理边界
单座数据中心已经被推到 GW 量级,电力和散热都到了准国家级供给的天花板。再要"更大"必须先去和电网谈、和邻州谈、甚至和大气层谈。
资本边界
头部巨头单家年资本开支已经爬到千亿美金量级。当 capex 触到投资者的耐心边界,"花得更聪明"开始压过"花得更多"——这是华尔街从今年起反复传递的信号。
需求边界
应用层进入 Agent 时代——一个任务可能要调用上百次模型。再用千亿级模型逐次调用,单次几美分变成单任务几美金,没有 SaaS 能消化这种成本。"高频低成本"成为产品级硬需求。
三个边界同时变硬,"效率"才被推到桌首。
四、"效率"不是一个指标,是一个度量族
很多人把"AI 效率"理解成"每 token 几美分"——这只是其中最浅的一层。真正的"效率"是一组同时被关心的比值,缺一不可。
— 效 率 不 是 一 个 数 —
而是一组比值
COMPUTE
能力 / 算力
每浮点运算能换多少正确答案
MEMORY
能力 / 内存
每 GB 内存能持续保留多少上下文
TIME
能力 / 延迟
每秒能给出几个有用的判断
COST
能力 / 美金
每一美金能买到多少可用智力
"四个比值都要看,缺一个就被对手抓住。"
这四个维度之间还会互相挤压——把内存压下去可能拖慢延迟,把延迟降下来可能拉高算力。真正的"效率冠军"是四个比值都向好那个,不是只赢一个数字的。
五、这一轮和上一轮的本质区别
上一轮和这一轮,看上去都在"造模型"——但底层逻辑已经完全不同。
上一轮 · 研究项目
目标是"探边界"——能不能做出更聪明的模型。这是研究问题,绝对性能就是 KPI,成本不太重要。
这一轮 · 工业品
目标是"摊薄"——同样的能力卖给所有人。这是工业问题,单位成本性能就是 KPI,绝对性能是入场券、不是赢的方式。
真正的转弯
AI 从"少数实验室能做的事",变成"所有公司都要采购的事"。从研究项目到工业品的拐弯,每个技术周期都发生过——电力、汽车、半导体——拐弯之后赢家全换。
真正的拐点不是模型变小,是衡量标准变了。
六、AKASHA 看到的是一个新单位的诞生
每一个新经济周期,都会先诞生一个新的"度量单位"——一开始只在行业内流通,后来变成所有人讨论这个时代的通用语。
工业时代
先有马力,后有BTU——蒸汽机和锅炉之间的较量需要新单位。今天我们说一辆车几匹马、一台空调几 BTU,习以为常;当年是刚被发明出来的新词。
信息时代
先有bps,后有MIPS / FLOPS——通信和计算之间的较量需要新单位。这一套词今天还在用,但它们也是某一年突然被发明出来的。
AI 时代
还没有真正普世的单位。"每美金多少 tokens"是粗糙版本,但它不衡量"智力密度"。"基准分"是学术版本,但它不衡量"工业可用度"。这一层缺一个——所有人能用同一把尺子,来比"AI 这一档资源"的真实价值。
AKASHA 看到的不是"这一周谁家的效率数字更好看"——是这个时代正在诞生一种新的度量衡。Hetu 押的也不是"我们会成为最高效的模型公司",而是建立一种所有人都得用、谁都不拥有的 AI 效率与价值度量协议——让模型之间、Agent 之间、调用方与被调用方之间,第一次拥有可比的、可结算的、可争议的统一单位。
这是上一时代的 ISO、CGPM、IEC 在做的事——只是下沉到 AI 这一层。新经济的真正基础设施,是它的度量衡,不是它的车间。
七、给读者的三个问题
问题一
你今天为 AI 付费的时候,付的是"参数费"、"算力费"还是"智力费"?这三种之间的差,决定了你被哪一类对手抢走。
问题二
如果"工业品阶段"已经到来,"我家模型最强"还是值得追的目标吗?还是"我家模型每美金最聪明"才是?
问题三
上一时代的国际度量局花了五十年才被全球公认。AI 时代如果还需要五十年定一种统一单位,赢家会是谁?早做这件事的人是不是已经站在桌首的位置?
如果这篇文章让你重新看了一眼"AI 的胜利标准"——
欢迎加入 AKASHA 的知识星球,一起讨论 AI 时代的新度量衡。
AKASHA · 2026.05.13
夜雨聆风