今天,AI 圈发生了几件事。
英伟达开源了一个框架,让一个只有 40 亿参数的小模型,在编程任务上的表现暴涨了将近 6 倍。
几乎同一时间,DeepSeek 被曝正在筹备科创板 IPO,估值冲到 3500 亿人民币。
而大洋彼岸,一家叫 Cognition 的公司,估值已经到了 260 亿美元——它只有一个产品,就是用 AI 帮人写代码。
这三件事,看起来互不相干,但把它们放在一起看,你会发现一个清晰无比的信号。
AI 编程,正在成为 AI 行业第一个真正赚到钱的赛道。而中国公司,正在同时完成两件事:追平和领跑。
40 亿参数的小模型,为什么能让编程能力暴涨 6 倍?
先说第一件事:英伟达的 Polar 框架。
5 月 28 日,英伟达研究团队开源了一个叫 Polar 的强化学习训练框架。它做的事情听起来很技术,但逻辑非常朴素。
现在的 AI 编程工具,比如 Codex、Claude Code、Qwen Code,它们的"大脑"是一个大模型,但"手脚"是一套代码执行框架。传统上,要训练这个"大脑"变得更聪明,你得把整个"手脚"——就是代码执行环境——改写成一堆 env.init()、env.step() 这种强化学习接口。
这件事的成本极高。不是技术难度高,而是你要把已有的工具链整个拆了重装。
Polar 的做法完全不同。
它不在"手脚"上动手术,而是在"大脑"和"手脚"之间的接口上放了一个智能体。模型发出的指令经过这个智能体,训练信号被记录、重放、优化,再喂回模型。
结果呢?
实验数据非常震撼。
基于同一个 Qwen3.5 的 40 亿参数底座模型——注意,只有 40 亿参数,比你手机上的很多模型都小——接入 Polar 做 GRPO 强化学习训练后,Codex 在 SWE-Bench Verified 上的 pass@1 分数从 3.8% 窜到了 26.4%。
暴涨 594.74%。
什么概念?一个原来几乎不能用的小模型,训练之后开始能正经完成复杂的代码仓库修改任务了。
更关键的是效率。Polar 用了一种叫 prefix_merging 的技术,把训练步数从 1185 次压缩到 218 次,墙钟时间从 189 分钟降到 35 分钟。GPU 利用率从 20.4% 飙升到 87.7%。
也就是说,不仅效果好,而且成本低。
这件事传递的信号非常明确:在 AI 编程这条赛道上,模型的大小不再是唯一的决定因素。一个好框架,能让小模型做大事。
这很像是当年互联网行业的"轻资产"逻辑——不拼资源总量,拼资源利用效率。
Cognition 估值 260 亿美元:AI 编程正在成为最赚钱的赛道
说完技术,我们来看商业。
同样是今天,AI 编程公司 Cognition 宣布完成超 10 亿美元融资,估值达到 260 亿美元。领投方包括 Lux Capital、General Catalyst 和 8VC,彼得·蒂尔的 Founders Fund 也有重大参与。
这家公司只有一个产品:Devin——一个能自主完成软件开发全流程的 AI 智能体。
Devin 去年刚出来的时候,很多人觉得是噱头。一个 AI 说能独立写代码、修 Bug、部署应用——听起来太像科幻了。
但数据不会骗人。
Devin 的年化收入(ARR)从 2024 年 5 月的 3700 万美元,一年内增长到今天的 4.92 亿美元。增长了超过 13 倍。
它的客户名单里,有高盛、梅赛德斯-奔驰,以及美国政府的多个部门。
Cognition 内部超过 90% 的代码,是由 Devin 自己写的。
CEO Scott Wu 说过一句话很有意思:"随着模型层竞争加剧,结合使用多种模型的效果远优于依赖单一模型。"
这就是 AI 编程赛道的商业逻辑——你不必是模型层最强的那个,你可以站在所有模型之上,做那个"整合者"。
260 亿美元的估值放在整个 AI 行业是什么水平?它让 Cognition 成为全球最大的独立智能体实验室。据钛媒体报道,AI Coding 已经成为仅次于基础大模型的第二大 AI 细分市场。
而且,这个市场还在以肉眼可见的速度膨胀。SpaceX 据说正在谈以 600 亿美元收购 Cursor——另一家 AI 编程工具公司。
600 亿美元。这已经不是一个"赛道"了,这是一个战场。
DeepSeek 冲击科创板:中国 AI 的新叙事
再把目光转回国内。
DeepSeek 正在启动成立以来的首次融资。目标金额 500 亿人民币,投后估值 3500 亿。
创始人梁文锋自己出资 200 亿,占融资总额的 40%。
而更关键的一条消息是:据参与本轮融资的基金经理透露,DeepSeek 计划在完成本轮融资后,立即申请科创板 IPO。
如果成行,这将是"中国 AI 第一股"。
你想想这意味着什么。
一家坚持完全开源路线、不以短期商业化为目标的大模型公司,即将登陆中国资本市场。这不仅仅是 DeepSeek 一家的事,而是整个中国 AI 行业的叙事转折。
过去两年,中国 AI 行业有一个"房间里的大象"式的问题:技术很强,但怎么赚钱?
DeepSeek 的模型能力有目共睹。开源社区里,它的使用量、衍生项目数量、第三方集成的广度,在全球范围内都是第一梯队。
但它一直走的是一条"先开源,再想商业模式"的路。这条路在硅谷很常见——想想 Red Hat,想想 MongoDB——但在中国,尤其是在 AI 领域,这是第一次有公司用这种方式走到 IPO 门口。
3500 亿的估值,说明资本市场买单了。
同一天的另一条消息可以作为佐证:阿里通义千问的 Qwen3.7-Max,以 773 亿 tokens 的使用量,登顶了全球最大的 API 聚合平台 OpenRouter 的热门大模型排行榜。
773 亿 tokens。这是实打实的使用量,不是跑分,不是论文引用数。全球开发者正在用脚投票,把中国开源模型选为最实用的工具。
从"追赶"到"并跑",再到某些细分领域"领跑"——中国 AI 正在走这样一条路。
三条线,一个方向
把这三件事串在一起,你能看到什么?
英伟达 Polar 框架证明了一件事:AI 编程不需要天价算力。小模型 + 好框架,就能做出大模型的效果。这降低了整个赛道的准入门槛。
Cognition 260 亿美元估值证明了另一件事:AI 编程是能赚大钱的。Devin 的 4.92 亿美元年化收入不是 PPT 数字,是已经在银行里的钱。AI 行业喊了两年"商业化",编程赛道率先跑通了。
DeepSeek 冲击科创板,则在说第三件事:中国 AI 公司在这条赛道上不是旁观者,而是深度参与者。开源模型 + 全球开发者生态 + 本土资本市场——这个三角一旦闭合,能量会非常大。
这三件事指向同一个方向:AI 正在从"炫技"阶段进入"赚钱"阶段。而编程,是第一个被 AI 彻底重构的行业。
这不是一个"会不会发生"的问题。它已经在发生了。
最后说两句。
如果你是一个开发者,Polar 这样的框架意味着,用很小的成本就能训练出一个帮你写代码的 AI 助手。这件事的天花板,远比想象的高。
如果你是一个创业者或者投资人,Cognition 和 DeepSeek 的故事告诉你,AI 编程赛道正在经历"钱找人"的阶段——大量资本在主动寻找这个方向上的机会。
而如果你只是一个对 AI 感兴趣的普通人,至少要知道一件事:AI 写代码这件事,已经不是一个"未来趋势"了。它正在变成基础设施。
就像二十年前的搜索引擎,十年前的云计算。
当一件事变成基础设施,所有站在上面的人都会受益。而最早意识到这一点的人,受益最大。
夜雨聆风