2025年1月20日,杭州一家成立仅一年多的公司发布了一个模型,名叫 R1。没有发布会,没有预告,甚至没有像样的新闻稿。但上线 21 天后,它的日活用户达到了 2215 万——比 ChatGPT 当年的增长速度还快。全球 AI 圈在震惊中反应过来时,发现一个事实:烧钱堆算力的游戏规则,被改写了。
一、冰山浮出水面
2025 年 1 月 20 日,一个普通的星期一。全球科技媒体都在关注特朗普即将在当天举行的就职典礼,没有人把目光投向杭州。
深度求索(DeepSeek)就在那天发布了 R1。训练成本不到 GPT-4 的十分之一,性能却与 GPT-4 比肩。更惊人的是——它开源了。
这意味着任何一个有 GPU 的开发者,都可以在自己的服务器上跑一个接近 GPT-4 水平的模型。成本从"我需要几千万美元"变成了"我只需要几台服务器"。
消息在开发者社区里像病毒一样扩散。DeepSeek 的 GitHub 仓库在一夜之间涌入了几万颗星。Hugging Face 上的下载量在 72 小时内突破了百万。Twitter(当时还叫 X)上的 AI 圈所有人都在问同一句话:"Who are these people?"
新华社后来用了一个词总结这一年:"破壁时刻"——AI 的高墙,被杭州的一个小团队凿开了一道口子。
但梁文锋后来在接受采访时说了一句更让人回味的话:"我们从未想过要成为颠覆者,这一切只是意外发生的。"
一年后,2026 年 4 月 24 日,凌晨。另一个消息炸醒了全球 AI 圈——OpenAI 发布了 GPT-5.5,大幅提价、深度闭源。标准版输出每百万 Token 高达 180 美元。
几个小时后,DeepSeek 的公告来了。V4 系列发布——1.6 万亿参数,百万级上下文,全面开源。价格呢?V4-Flash 每百万 Token 输出仅 0.279 美元。
同一天,两个模型,两条路线。价差 645 倍。这不是巧合。
《2026 年 4 月全球 AI 热点月报》后来写道:"这不是巧合,是路线分野的终极宣言——OpenAI 筑墙,DeepSeek 拆门。"
如果说 2023 年是"大模型元年"——所有人都知道了 AI 很厉害;那 2025-2026 年就是"AI 破壁之年"——所有人都能用上顶尖 AI 了。
而比模型本身更意味深长的,是 DeepSeek V4 的技术报告中,华为昇腾 NPU 首次与英伟达 GPU 并列写入硬件验证清单。DeepSeek 的技术架构从英伟达 CUDA 彻底转向了华为 CANN 框架。英伟达 CEO 黄仁勋在九天前的播客中预言:"如果 DeepSeek 在华为平台上发布,对我们来说将是灾难性的。"九天之后,一语成谶。
二、三个人的 2025-2026
梁文锋:200亿的理想主义
2023 年,梁文锋带着十几人的核心团队离开阿里达摩院,创办了深度求索。
那年国内大模型赛道已经挤满了玩家——几十家公司一起冲进来,烧钱、抢卡、抢论文、抢概念。巨头有资源,资本有耐心,媒体有故事。只有 DeepSeek 看起来太小了。
但梁文锋有一条别人没有的路——他是幻方量化的联合创始人。幻方量化是中国最赚钱的量化投资公司之一,年赚数百亿。梁文锋做的决定是:用量化交易赚来的利润,补贴 AI 研发。
2025 年 R1 发布成功后,他又做了一件让所有人震惊的事:自掏 200 亿元,给 DeepSeek 注入了一笔当时中国 AI 界最大规模的单笔融资。那 200 亿不是来自 VC,不是来自政府补贴,是他个人的钱。
有媒体问他:"你用个人财富为公司续费,万一失败了呢?"他回答:"做 AI 不是赌博。赌徒怕输,但做研究的人不怕——因为每一步,即使走错了,也是在拓宽边界。"
这句话让很多人想起了一个人——2012 年的王小川,也是拿个人全部身家赌搜狗的移动转型。但王小川赌的是一个公司,梁文锋赌的,是一个国家的 AI 底牌。
2026 年 4 月,当 DeepSeek V4 全面转向华为昇腾时,梁文锋只说了一句话:"过去 30 多年的 IT 浪潮,中国基本上扮演追随者的角色。随着经济发展,中国应该逐步成为技术创新的主要贡献者。"
Sam Altman:守城者的抉择
2026 年的 Sam Altman 面临的是一个两难局面。
他带领 OpenAI 做出了人类历史上最重要的 AI 产品——ChatGPT 和 GPT-4。但在 2025-2026 年,OpenAI 的护城河正在以肉眼可见的速度被侵蚀。
一边是开源模型的步步紧逼——DeepSeek R1 在性能上追平 GPT-4,而成本只有几十分之一。另一边是资本市场的期待——OpenAI 计划在 2026 年下半年提交 IPO 申请,需要向投资人证明盈利模型。
Altman 做出了一个决定:闭源、提价、深度嵌入企业生态系统。GPT-5.5 的标准版输出定价每百万 Token 180 美元——几乎是 DeepSeek V4-Flash 的 645 倍。同时,OpenAI 将 GPT-5.5 更深地嵌入了 Codex——让 AI 从"帮你写几行代码"变成"接管整个工作流程",从操作浏览器到控制电脑。
有人问 Altman 是否担心开源模型的竞争。他说:"我们造的不是一个工具,是一个操作系统。操作系统的价值不在于它本身有多强大,而在于它上面跑了多少应用。"
这句话翻译过来就是:OpenAI 不再卖模型了,它要卖生态。
但 DeepSeek 也有自己的生态——而且是开源的。2026 年 4 月,已有 8 家国产 AI 芯片品牌和多家云服务商宣布适配 DeepSeek V4。英伟达也宣布适配 DeepSeek——这个画面充满了黑色幽默:被挑战的闭源王者,在为挑战者的开源生态提供硬件支持。
黄仁勋:从独裁者到布道者
2025 年初,黄仁勋还是 AI 世界最有权势的人。英伟达的 GPU 是"AI 军火"的代名词,英伟达市值一度突破 4 万亿美元,超过整个德国股市的总和。全球所有的大模型,从 OpenAI 到 Google 到百度到阿里,都依赖英伟达的芯片。他是科技界的"皇帝"。
但 DeepSeek R1 改变了一切。当梁文锋证明用少量算力也能训练出顶级模型时,英伟达的股价在 2025 年 1 月暴跌了 17%。华尔街开始质疑:如果 AI 不再需要那么昂贵的算力,英伟达的高估值还站得住吗?
2025 年下半年,黄仁勋开始了一场全球巡回的"AI 布道之旅"。他在每一个场合都在讲一个观点:"推理计算的需求将远远超过训练计算。"他的潜台词是:DeepSeek 确实降低了训练成本,但一旦 AI 广泛应用,推理侧的需求将指数级增长——而推理同样需要英伟达的芯片。
2026 年 4 月 15 日,他在播客专访中说了一句话,后来被传为经典:"如果 DeepSeek 在华为平台上发布,对我们来说将是灾难性的。"
九天之后,DeepSeek V4 正式发布,华为昇腾 NPU 与英伟达 GPU 被并列写入硬件验证清单。
黄仁勋的"灾难性预言"变成了现实。但他的反应比所有人预想的都要冷静——英伟达随即宣布也适配 DeepSeek V4。"我们不能阻止它,那就加入它。"这句话不像是一个被挑战的王者说的,更像是一个看清了历史方向的人。
三、破壁之后的众生相
2025-2026 年,AI 不再只是聊天框里的文字。它开始拥有眼睛、耳朵、手指和身体。
字节跳动的 Seeduplex在 2026 年 4 月 9 日发布了一款原生全双工语音大模型。你可以像和人说话一样跟它对话——它可以"边听边说",可以打断你的话,可以发出语气词,可以在你说"等一下让我想想"的时候安静地等着你。这不是 Siri,不是小爱同学,不是任何语音助手。它是一个能听懂你语气、判断你情绪的"对话者"。
波士顿动力的电动 Atlas不再只是实验室里的杂技演员。2026 年,它走出了实验室,进入了真实的工厂车间。强化学习和动作捕捉让它学会了搬运、组装、巡逻——不是被编程的机械动作,而是像人一样自己"学会"的。它摔倒了会自己爬起来,发现障碍物会绕路,遇到门会先拉再推。
优必选、宇树科技、智元机器人——中国的人形机器人公司在 2025 年实现了全球出货量突破 1.3 万台,同比暴增 465%。其中宇树科技的净利率达到 35%,成为全球最赚钱的人形机器人公司之一。星动纪元在两个月内完成近 25 亿元融资,2026 年二季度开启了千台级机器人交付。灵心巧手单月出货超 4000 台——不是整机,是机器人的"手"。当 AI 的大脑长出了手指,人类社会准备好迎接了吗?
2026 年 4 月 27 日,百度发布的 GenFlow 4.0 月活用户突破 1 亿。这个概念背后的现实是:AI 智能体不再只是"聊天",它在帮你做 PPT、写 Excel、弄 Word、管理日程、操作浏览器。百度宣称 GenFlow 的月度智能任务交付量达到 2 亿次——也就是说,AI 每个月替你干了两亿件"你以前必须自己干"的事。
阿里 Qwen3.6系列在 4 月登顶了 OpenRouter 全球调用榜。腾讯混元 Hy3 Preview开源了快慢思考融合的混合专家模型。火山引擎把 AI 智能体融入了汽车座舱——你不需要说"打开空调",只需要说"我有点热",AI 就能从语气中判断出你是真的热还是随口一说,然后决定是否打开空调。
而在老年大学的教室里,AI 这个词正在被重新定义。2025 年 2 月,湖北襄阳老年大学开设了一门新课——教老人们用 DeepSeek。银发的学生们戴着老花镜,在手机上一笔一划地打出"帮我写一首关于春天的诗",然后看着屏幕上的诗句露出笑容。有一位老人的子女后来告诉老师:"我妈学会了让 AI 写春联,今年春节她一个人写了全村的春联。"
杭州的宽容试错、鼓励探索营商环境下,无数个类似 DeepSeek 的团队正在默默生长。而在北京,中国科学院自动化研究所的研究员们正在把大模型的知识蒸馏进更小的芯片——让 AI 不再需要数据中心,它可以嵌入一个耳机、一副眼镜、一枚纽扣。
尾声:当 AI 不再是工具,它变成了什么?
2025 年 8 月,国务院印发了《关于深入实施"人工智能+"行动的意见》。到 2027 年,AI 将与 6 大重点领域广泛深度融合。工信部的数据显示,中国已发布超过 1500 个行业模型,覆盖 50 个重点行业、700 余个应用场景。
而回到 2025 年 1 月 20 日那个星期一——当全世界的目光都聚焦在华盛顿的就职典礼上时,杭州的一间办公室里,一个叫梁文锋的人刚刚在键盘上敲下了 R1 的最后一行代码。他关掉编辑器,看了一眼手机,没有人知道发生了什么。
在之后的一年里,这条代码引发的震荡波及了整个人工智能产业:算力结构从"训练主导"转向"推理主导",开源模型第一次证明可以追上闭源,中国的 AI 芯片第一次被写入世界级模型的技术报告,而一个非英语母语的团队第一次在 AI 基础模型的竞争中站在了最前面。
DeepSeek 官方在 V4 发布时写道:"作为开源社区的一员,我们相信,每一行分享的代码,都将汇聚成推动进步的力量。"
当我们回看 2023 年的"你好,我是 ChatGPT"——那是 AI 学会说话的时刻。再看到 2025 年的 R1——那是 AI 学会被所有人拥有的时刻。再看到 2026 年 4 月 24 日——那是两条道路分道扬镳的时刻。
而这距离 1994 年那条 64K 专线接入中国,刚好过去了 32 年。从瀛海威科教馆里排队上网的年轻人,到 2012 年第一次用手机刷微博的你,再到 2023 年对 ChatGPT 说出第一句"你好"的你,再到 2026 年 AI 开始替你干活的这一刻——这三十二年来的一切,都在指向一个越来越清晰的答案:
AI 不是工具,AI 是基础设施。就像 1994 年的互联网一样——当时所有人也在问同样的问题:这东西到底有什么用?
但当文明的齿轮从网页转到应用,再从应用转到对话,最后从对话转到"它替你干了"的时候,我们听到的,仍然是那一声清脆的——
咔嚓。

参考信息:DeepSeek R1 于 2025 年 1 月 20 日发布,上线 21 天日活 2215 万;DeepSeek V4 系列于 2026 年 4 月 24 日发布,参数规模 1.6T,全面转向华为昇腾;OpenAI GPT-5.5 于同日发布,输出 180 美元/百万 token;黄仁勋 2026 年 4 月 15 日播客专访预言;GenFlow 4.0 月活突破 1 亿(2026 年 4 月 27 日);字节跳动 Seeduplex 全双工语音大模型于 2026 年 4 月 9 日发布;阿里 Qwen3.6 于 2026 年 4 月 20 日发布;2025 年全球人形机器人出货量突破 1.3 万台,同比增长 465%。国务院《关于深入实施"人工智能+"行动的意见》于 2025 年 8 月发布。
夜雨聆风