OpenAI、Anthropic、中国DeepSeek同周出手,AGI竞赛进入白热化阶段
这大概是AI史上最高能的一周。
GPT-6代号"土豆"横空出世、Claude Opus 4.7编程能力单代暴涨11个百分点、DeepSeek打破"从不融资"铁律——三家AI顶流,同一周密集出手,整个行业被彻底点燃。
OpenAI说这是"AGI最后一公里",Anthropic说"最强公开可用模型",DeepSeek说"V4彻底摆脱英伟达"。三方隔空喊话,火药味十足。
🔥 AI超级周·三大核弹一览
GPT-6
代号"土豆"(Spud)
5-6万亿参数
200万Token上下文
性能提升40%
Claude 4.7
Anthropic旗舰模型
编程SWE-bench 64.3%
碾压GPT-5.4(57.7%)
视觉暴涨3倍
DeepSeek
中国AI黑马
首次开放融资
估值超100亿美元
V4下旬发布
一、GPT-6代号"土豆":18个月、20亿美元、10万张H100
4月14日,OpenAI正式发布GPT-6(代号"Spud",中文:土豆)。这个名字接地气到让人意外,但产品力却一点都不"土豆"。
OpenAI为这颗"土豆"投入了惊人的资源:历时18个月、耗资超20亿美元、调用约10万张英伟达H100 GPU,最终训练出这颗参数量达5-6万亿级别的巨无霸。
GPT-6采用混合专家(MoE)架构,实际每次推理只激活约10%的参数,在保持强悍性能的同时大幅优化了计算效率。
最炸裂的升级是200万Token上下文窗口——相当于约150万字,两部《三体》一次性塞进去还有余。Altman直接称之为"AGI最后一公里"。
📊 GPT-6核心性能指标对比:
• 参数规模:5-6万亿(MoE架构),较GPT-5.4提升约3倍
• 上下文窗口:200万Token,较GPT-5.4提升15.6倍
• 综合性能提升:40%
• 数学推理准确率:92.5%
• 代码通过率:96.8%
• 83%职业任务达专家级水平
GPT-6还采用了全新的Symphony原生多模态架构,实现文本、音频、图像、视频的跨模态统一理解,不再是简单的拼凑式多模态。
定价方面,企业API已开放,4月底面向Plus用户,价格为2.5/12美元/百万Token,与GPT-5.4基本持平。OpenAI内部戏称这是"神话级智能,Sonnet级定价"。
二、Claude Opus 4.7深夜发布:编程能力暴涨11个百分点,直接碾压GPT-5.4
就在GPT-6发布两天后,北京时间4月16日深夜,Anthropic悄悄上线Claude Opus 4.7。官方宣称这是"最强公开可用AI模型",并给它贴上了一个鲜明的标签:"靠谱"——敢于反驳用户的错误方案,主动解决问题。
这次升级最硬核的数据来自编程领域。在业界公认的硬核基准SWE-bench Pro测试中,Claude Opus 4.7得分直接从上代53.4%跳涨至64.3%,单代提升近11个百分点——比GPT-5.4的57.7%高出近7个百分点。
在更细化的SWE-bench Verified测试中,Opus 4.7达到87.6%;在开发者实际使用的CursorBench(IDE内自主编程能力测试)中,得分从58%大幅提升至70%。
视觉能力同样暴涨3倍——支持最长边2576像素的高清图像输入(约375万像素),XBOW视觉准确率测试从54.5%直接跳到98.5%。
不过Opus 4.7并非全面领先——在Agentic搜索评测BrowseComp上,得分从上代83.7%降至79.3%,被GPT-5.4(89.3%)反超。Anthropic坦诚表示,更强的Claude Mythos Preview仍在测试阶段。
整体而言,Opus 4.7在直接可比基准上以7比4的优势领先GPT-5.4。定价维持输入每百万5美元、输出每百万25美元不变。
三、DeepSeek打破"不融资"铁律:估值681亿,V4要用华为昇腾
4月17日,一则消息搅动全球AI圈:长期以"不差钱"著称的中国AI黑马DeepSeek,正计划开启成立以来的首次外部融资——目标估值超100亿美元(约合人民币681.8亿元),计划募资至少3亿美元(约合人民币20.5亿元)。
DeepSeek由量化巨头幻方量化孵化,此前曾多次拒绝国内顶级风投和科技巨头的融资邀约,坚持"自给自足"。这次突然转向,震动行业。
这背后折射的是:全球AI军备竞赛进入白热化阶段——资金需求呈指数级攀升,即使是"财大气粗"的幻方量化,也难以独自支撑V4这样的大模型研发。
更劲爆的消息是——DeepSeek V4将于4月下旬发布,据说将"彻底摆脱英伟达",有望采用华为昇腾芯片。这意味着国产大模型在芯片自主可控上迈出关键一步。
DeepSeek创始人梁文锋曾以"坚决不融资"闻名,如今终于"向资本低头"。有分析认为,这是他从技术"理想主义"走向商业"现实主义"的标志性转折,也预示着中国AI企业正在加速融入全球资本竞争的版图。
四、超级周背后的深层逻辑:大模型竞争进入新阶段
一周之内,三大AI顶流同时出手。这不是巧合,背后有清晰的趋势信号:
🔍 趋势一:从"跑分"到"工程落地"
GPT-6的Symphony原生多模态、Claude 4.7的"靠谱"特质(敢于反驳用户错误方案),都在说明一个事实:大模型的竞争已从单纯的基准测试,转向真实场景的可靠性和可控性。
🔍 趋势二:算力自主化加速
OpenAI 200亿美元押注Cerebras、DeepSeek V4要用华为昇腾——科技巨头和AI新贵都在努力摆脱对英伟达的单一依赖,AI芯片格局正在重构。
🔍 趋势三:中国力量全面崛起
DeepSeek百亿美元融资+V4即将发布、阿里Qwen系列持续突破……中国AI军团正在从"追赶者"向"并跑者"乃至"领跑者"的角色转变。
🔍 趋势四:算力成本压力全面传导
RAMmageddon(存储末日)、Claude 4.7 Token消耗增加1-1.35倍、全球算力涨价潮蔓延——AI的高速发展正在遭遇能源和算力的物理极限。
写在最后
GPT-6说"AGI最后一公里",Claude 4.7说"最强公开可用",DeepSeek说"V4彻底摆脱英伟达"——三家都在喊话,但谁才是真正的王者?
真相是:没有哪一家能独自定义AGI。这一周的超级周,恰恰说明了AI竞赛正在进入一个多极竞争的新时代——OpenAI、Anthropic、DeepSeek,以及还在暗处蓄力的谷歌、Meta、阿里、百度,每一家都有可能在下一个节点改写格局。
作为普通用户和从业者,唯一能做的就是——系好安全带,这场竞赛只会越来越快。
来源:IT之家、快科技、新浪财经、CSDN、The Information | 整理:数码充能站
夜雨聆风