
一只蝴蝶,引发硅谷海啸
2025年开春,硅谷的科技精英们还在庆祝AI盛世。
OpenAI估值冲破3000亿美元,英伟达的股价像坐上了火箭。所有人都相信,这个时代的游戏规则已经写好——算力即权力,谁显卡多,谁就是赢家。
然后,一只来自杭州的蝴蝶扇动了翅膀。
一个消息像病毒一样在硅谷传播:一家没人听说过的中国公司,搞出了一个叫DeepSeek的东西,据说厉害得离谱。
起初没人当真。毕竟,中国AI公司“套壳”海外模型吹牛的案例太多了。但当第三方基准测试结果出来时,整个硅谷沉默了——DeepSeek在数学、代码、自然语言推理等核心任务上的表现,与GPT-4o不相上下,甚至在某些方面更胜一筹。
而它的训练成本,仅为GPT-4o的十分之一——约557.6万美元。
紧接着,英伟达的股票在一天之内暴跌17%。
近6000亿美元市值,相当于一整个波音公司加一整个英特尔,瞬间蒸发。华尔街的交易员疯了,他们疯狂地在彭博终端上搜索同一个问题:
“DeepSeek是谁?”
这个问题,就是我们的故事。
一个让钱“讨厌”的人
想搞懂DeepSeek,必须先搞懂它的创始人——梁文锋。
在这之前,梁文锋是一个让整个中国量化基金圈都敬畏的名字。
2015年,他创立幻方量化。到2021年,管理规模突破千亿大关,跻身中国量化私募“四大天王”。2025年,旗下基金平均收益率56.55%,近五年收益率均值高达114.35%。
有人算过,仅2025年一年,幻方就可能创造了超过7亿美元的收入。
这是一个能看穿市场底牌、把金钱游戏玩到极致的男人。如果他愿意,他可以成为这个时代最富有的人之一。
但就在所有人都以为他会继续闷声发大财时,他干了一件让所有人大跌眼镜的事——他用幻方赚来的钱,几乎全砸进了一个“无底洞”:自己做AI大模型。
更反常的是,当全世界最顶级的风险投资家们挥舞着支票簿,排着队要给他送钱时,梁文锋却几乎都拒绝了。据说有VC开出了天价估值,他连面都没见。
为什么?
在一次罕见的内部谈话中,他说出了原因:“不想被短期回报要求束缚。”
翻译一下:你们VC要的是三五年内上市套现,我要做的,是十年后才能看到结果的事情。我们不是一路人。
他用自己的钱,买了一个奢侈的东西——自由。不被资本绑架的自由,不被季度财报驱动的自由,想做什么就做什么的自由。
他用幻方这台“印钞机”赚来的钱,去喂养一个叫DeepSeek的理想国。
而他的理想国,有一个非常天真的核心理念:技术应该属于所有人。
这个理念,将颠覆整个AI产业。
全世界都走错了方向?
梁文锋看到的,是一个连OpenAI、Google都集体陷入的“思维陷阱”。
当时的AI世界信奉一条铁律:“算力即权力”。谁拥有的GPU多,谁的模型就强。这就导致所有巨头都在疯狂囤积英伟达的显卡,开启了一场没有尽头的“军备竞赛”。
GPT-4的训练成本在1亿美元级别。GPT-5呢?有人说要10亿。照这个趋势下去,未来只有国家级的玩家才能玩得起AI。
梁文锋觉得不对。
他觉得这就像为了跑得更快,就拼命给汽车加更重的轮子,而不是去改进发动机。所有人都陷入了“堆算力”的思维定式,却忘记了算法本身,才是真正的杠杆。
他问了一个很天真、但细想之下又很深刻的问题:
为什么AI要记住所有东西?
人读书,是先扫一遍,划重点,再精读。为什么AI要把整本《牛津词典》从头到尾、每个标点都背下来,才能回答一个简单的问题?
这个“天真”的想法,催生了DeepSeek的核武器——一种全新的“选择性注意力”机制。
你可以这样理解:
其他AI:像一个记忆力超群但毫无效率的学生,必须把整本书都背下来。你问他“苹果是什么颜色”,他得先把全书扫描一遍,确认没有“苹果是蓝色”的说法,才敢回答“红色”。
DeepSeek:像一个聪明的学者,拿到一本书,先快速翻一遍,在脑子里建一个“索引”。然后你问他任何问题,他都能瞬间定位到那一页,只精读那几十个词。
这个“翻一遍建索引”的动作,就是DeepSeek的核心创新。它让AI学会了“抓重点、略细节”,而不是事无巨细地记住一切。
在此基础上,DeepSeek还做了两件事:
第一,混合专家架构——给AI组建了一个专家团队。数学问题调数学专家,文学问题调文学专家,分工协作,各司其职。
第二,强化学习——让AI从“被动学习”变成“主动学习”。不再需要人类手把手地教,而是通过自我探索和试错,不断提升能力。
这些技术创新的叠加效应,让DeepSeek的推理速度飙升至60TPS,每百万Token成本仅为0.48美元。
当别人还在花几亿美金“造轮子”时,DeepSeek只花了几百万美金,就造出了一辆能和F1赛车跑得一样快的家用车。
但这还不是最让硅谷害怕的。
掀翻牌桌的“叛徒”
光自己厉害,还不足以搅动全球科技圈。
真正让硅谷感到恐惧的,是梁文锋的下一步——他决定掀翻整个牌桌。
当OpenAI、Google把自己的模型当作最高机密,连代码都不让人看一眼时,梁文锋做了一个在同行看来“自杀式”的决定:
把DeepSeek的核心技术,全部、彻底地公开——开源。
不仅仅是模型权重,连训练代码、数据处理工具、技术论文,全部公之于众。任何人在任何地方,都可以免费下载、使用、修改DeepSeek的技术,甚至用它来开发商业产品。
硅谷的同行们震惊了:“你这是把自己辛辛苦苦炼出来的绝世武功,免费教给全世界?你还怎么赚钱?”
梁文锋的回应很简单:“封闭只会让技术变慢,开源才能让AI走得更远。”
翻译一下:你们在乎的是怎么守住自己的护城河,我在乎的是怎么让整个行业跑得更快。
他不在乎只做一家赚钱的公司。他想做的,是成为整个AI世界的“基础设施提供商”。他把水、电、煤都铺好了,全世界的开发者都可以在这上面造自己的房子、开自己的店铺。
结果呢?
DeepSeek在开源社区GitHub上线不到3个月,其Star数量便超越OpenAI。全球超过12万开发者涌入,提交代码、发现bug、提出优化建议。
DeepSeek从一个中国公司的项目,变成了一个全球共建的生态系统。
腾讯元宝接入了DeepSeek,科大讯飞也接入了DeepSeek。在中国,DeepSeek已经成为开发者首选的AI基座模型之一。
2025年1月27日,DeepSeek-R1正式发布。在苹果App Store中国区免费榜,它荣登榜首;在美区免费榜,它从第6位迅猛攀升至第1位,超越ChatGPT、Google Gemini、Microsoft Copilot。
这一成绩,让全世界看到了中国AI技术的实力。
游戏规则已经改变
现在,我们再回到开头的那个问题:DeepSeek凭什么搅动全球科技圈?
答案不是因为它技术多牛,也不是因为它多便宜。
答案是:它改变了游戏规则。
它用事实证明,“算力军备竞赛”不是唯一的路。聪明的大脑,可以胜过成堆的显卡。
它用开源,挑战了巨头们用秘密和专利筑起的高墙。当全世界最先进的AI技术对所有人免费开放时,“护城河”这个词本身就失去了意义。
英伟达股价的暴跌,不是对DeepSeek的恐惧,而是市场终于意识到:未来的AI竞争,不再是“谁显卡多谁赢”的堆料游戏,而是“谁更聪明谁赢”的智力游戏。
DeepSeek这场“开源普惠式变革”,正在催生一个更开放、更多元的AI生态。国内AI产业链参与方,正在从“被动跟随”转向“主动引领”。
尾声:深度求索
一个值得玩味的细节是:梁文锋给自己的公司取名DeepSeek——中文意思是“深度求索”。
他要探寻的,从来不是下一个赚钱的风口,也不是一个能快速IPO的商业故事。
他要探寻的,是技术最深处、那道尚未被照亮的门。
他曾说过一句话:“技术的魅力,在于它永远为热爱它的人留着一扇门。”
而门后的世界,才刚刚开启。
夜雨聆风