AI 编程暴涨 6 倍,中国 AI 第一股来了

今天，AI 圈发生了几件事。

英伟达开源了一个框架，让一个只有 40 亿参数的小模型，在编程任务上的表现暴涨了将近 6 倍。

几乎同一时间，DeepSeek 被曝正在筹备科创板 IPO，估值冲到 3500 亿人民币。

而大洋彼岸，一家叫 Cognition 的公司，估值已经到了 260 亿美元——它只有一个产品，就是用 AI 帮人写代码。

这三件事，看起来互不相干，但把它们放在一起看，你会发现一个清晰无比的信号。

AI 编程，正在成为 AI 行业第一个真正赚到钱的赛道。而中国公司，正在同时完成两件事：追平和领跑。

40 亿参数的小模型，为什么能让编程能力暴涨 6 倍？

先说第一件事：英伟达的 Polar 框架。

5 月 28 日，英伟达研究团队开源了一个叫 Polar 的强化学习训练框架。它做的事情听起来很技术，但逻辑非常朴素。

现在的 AI 编程工具，比如 Codex、Claude Code、Qwen Code，它们的"大脑"是一个大模型，但"手脚"是一套代码执行框架。传统上，要训练这个"大脑"变得更聪明，你得把整个"手脚"——就是代码执行环境——改写成一堆 env.init()、env.step() 这种强化学习接口。

这件事的成本极高。不是技术难度高，而是你要把已有的工具链整个拆了重装。

Polar 的做法完全不同。

它不在"手脚"上动手术，而是在"大脑"和"手脚"之间的接口上放了一个智能体。模型发出的指令经过这个智能体，训练信号被记录、重放、优化，再喂回模型。

结果呢？

实验数据非常震撼。

基于同一个 Qwen3.5 的 40 亿参数底座模型——注意，只有 40 亿参数，比你手机上的很多模型都小——接入 Polar 做 GRPO 强化学习训练后，Codex 在 SWE-Bench Verified 上的 pass@1 分数从 3.8% 窜到了 26.4%。

暴涨 594.74%。

什么概念？一个原来几乎不能用的小模型，训练之后开始能正经完成复杂的代码仓库修改任务了。

更关键的是效率。Polar 用了一种叫 prefix_merging 的技术，把训练步数从 1185 次压缩到 218 次，墙钟时间从 189 分钟降到 35 分钟。GPU 利用率从 20.4% 飙升到 87.7%。

也就是说，不仅效果好，而且成本低。

这件事传递的信号非常明确：在 AI 编程这条赛道上，模型的大小不再是唯一的决定因素。一个好框架，能让小模型做大事。

这很像是当年互联网行业的"轻资产"逻辑——不拼资源总量，拼资源利用效率。

Cognition 估值 260 亿美元：AI 编程正在成为最赚钱的赛道

说完技术，我们来看商业。

同样是今天，AI 编程公司 Cognition 宣布完成超 10 亿美元融资，估值达到 260 亿美元。领投方包括 Lux Capital、General Catalyst 和 8VC，彼得·蒂尔的 Founders Fund 也有重大参与。

这家公司只有一个产品：Devin——一个能自主完成软件开发全流程的 AI 智能体。

Devin 去年刚出来的时候，很多人觉得是噱头。一个 AI 说能独立写代码、修 Bug、部署应用——听起来太像科幻了。

但数据不会骗人。

Devin 的年化收入（ARR）从 2024 年 5 月的 3700 万美元，一年内增长到今天的 4.92 亿美元。增长了超过 13 倍。

它的客户名单里，有高盛、梅赛德斯-奔驰，以及美国政府的多个部门。

Cognition 内部超过 90% 的代码，是由 Devin 自己写的。

CEO Scott Wu 说过一句话很有意思："随着模型层竞争加剧，结合使用多种模型的效果远优于依赖单一模型。"

这就是 AI 编程赛道的商业逻辑——你不必是模型层最强的那个，你可以站在所有模型之上，做那个"整合者"。

260 亿美元的估值放在整个 AI 行业是什么水平？它让 Cognition 成为全球最大的独立智能体实验室。据钛媒体报道，AI Coding 已经成为仅次于基础大模型的第二大 AI 细分市场。

而且，这个市场还在以肉眼可见的速度膨胀。SpaceX 据说正在谈以 600 亿美元收购 Cursor——另一家 AI 编程工具公司。

600 亿美元。这已经不是一个"赛道"了，这是一个战场。

DeepSeek 冲击科创板：中国 AI 的新叙事

再把目光转回国内。

DeepSeek 正在启动成立以来的首次融资。目标金额 500 亿人民币，投后估值 3500 亿。

创始人梁文锋自己出资 200 亿，占融资总额的 40%。

而更关键的一条消息是：据参与本轮融资的基金经理透露，DeepSeek 计划在完成本轮融资后，立即申请科创板 IPO。

如果成行，这将是"中国 AI 第一股"。

你想想这意味着什么。

一家坚持完全开源路线、不以短期商业化为目标的大模型公司，即将登陆中国资本市场。这不仅仅是 DeepSeek 一家的事，而是整个中国 AI 行业的叙事转折。

过去两年，中国 AI 行业有一个"房间里的大象"式的问题：技术很强，但怎么赚钱？

DeepSeek 的模型能力有目共睹。开源社区里，它的使用量、衍生项目数量、第三方集成的广度，在全球范围内都是第一梯队。

但它一直走的是一条"先开源，再想商业模式"的路。这条路在硅谷很常见——想想 Red Hat，想想 MongoDB——但在中国，尤其是在 AI 领域，这是第一次有公司用这种方式走到 IPO 门口。

3500 亿的估值，说明资本市场买单了。

同一天的另一条消息可以作为佐证：阿里通义千问的 Qwen3.7-Max，以 773 亿 tokens 的使用量，登顶了全球最大的 API 聚合平台 OpenRouter 的热门大模型排行榜。

773 亿 tokens。这是实打实的使用量，不是跑分，不是论文引用数。全球开发者正在用脚投票，把中国开源模型选为最实用的工具。

从"追赶"到"并跑"，再到某些细分领域"领跑"——中国 AI 正在走这样一条路。

三条线，一个方向

把这三件事串在一起，你能看到什么？

英伟达 Polar 框架证明了一件事：AI 编程不需要天价算力。小模型 + 好框架，就能做出大模型的效果。这降低了整个赛道的准入门槛。

Cognition 260 亿美元估值证明了另一件事：AI 编程是能赚大钱的。Devin 的 4.92 亿美元年化收入不是 PPT 数字，是已经在银行里的钱。AI 行业喊了两年"商业化"，编程赛道率先跑通了。

DeepSeek 冲击科创板，则在说第三件事：中国 AI 公司在这条赛道上不是旁观者，而是深度参与者。开源模型 + 全球开发者生态 + 本土资本市场——这个三角一旦闭合，能量会非常大。

这三件事指向同一个方向：AI 正在从"炫技"阶段进入"赚钱"阶段。而编程，是第一个被 AI 彻底重构的行业。

这不是一个"会不会发生"的问题。它已经在发生了。

最后说两句。

如果你是一个开发者，Polar 这样的框架意味着，用很小的成本就能训练出一个帮你写代码的 AI 助手。这件事的天花板，远比想象的高。

如果你是一个创业者或者投资人，Cognition 和 DeepSeek 的故事告诉你，AI 编程赛道正在经历"钱找人"的阶段——大量资本在主动寻找这个方向上的机会。

而如果你只是一个对 AI 感兴趣的普通人，至少要知道一件事：AI 写代码这件事，已经不是一个"未来趋势"了。它正在变成基础设施。

就像二十年前的搜索引擎，十年前的云计算。

当一件事变成基础设施，所有站在上面的人都会受益。而最早意识到这一点的人，受益最大。