这周AI圈炸了。GPT-6带着200万Token上下文窗口正式登场,OpenAI直接把定位写成了"AGI的最后一公里"。另一边,Anthropic先发Claude Mythos惊爆安全圈,再融300亿美元估值3800亿反超OpenAI营收,接着Claude Opus 4.7上线却随即被锤"降智"——一周之内冰火两重天。
国内战场同样精彩:阿里ATH连放HappyOyster世界模型和Meoo开发工具,腾讯混元3D世界模型2.0开源,智元机器人一口气发布4款本体+4大模型+7大方案,DeepSeek宣布首轮融资。世界模型、具身智能、Agentic Coding三条主线同时爆发。
黄仁勋在播客里说了句大实话:"英伟达的本质是——把电子转化为Token。"这句话,可能比任何财报都值钱。

市场动态
大模型军备竞赛
4月12日
OpenAI GPT-6发布倒计时不足48小时,性能暴涨40%传闻引发全球开发者高度关注 Anthropic旗舰模型Claude Mythos正式登场,能自主发现数千个zero-day安全漏洞,仅向12家科技巨头开放 DeepSeek V4万亿参数架构曝光,确认将全面换装华为昇腾950PR芯片
4月14日
OpenAI正式发布GPT-6(代号"Spud"),5-6万亿参数,200万Token上下文窗口,采用Symphony全模态架构实现原生多模态统一处理,定位"AGI的最后一公里",性能较GPT-5.4提升40% MiniMax正式上线全球首个云端自我进化AI助手MaxHermes,基于Hermes Agent构建,10秒内即可在云端部署
4月15日
阿里开源Qwen3.6-35B-A3B,编程能力超越2-3倍参数量的GLM-5、Kimi-K2.5,成为国产编程最强模型 阿里ATH事业群发布旗下首款AI开发工具Meoo(秒悟),集成千问、Kimi、GLM、MiniMax四大顶尖模型
4月16日
阿里ATH发布开放式世界模型HappyOyster(快乐生蚝),原生多模态架构,支持文本、图像、音频、视频多模态输入与音视频联合流式生成,与谷歌Genie 3正面竞争 腾讯发布混元3D世界模型2.0(HY-World 2.0)并开源,能根据文字、图片、视频直接生成可编辑、可交互的3D世界 百度文心开源文生图模型ERNIE-Image
4月17日
Anthropic正式发布Claude Opus 4.7,金融分析能力登顶公开模型,软件工程、多模态全面进阶,Claude Code同步迎来v2.1.111重大更新 小马智行发布PonyWorld世界模型2.0,将自动驾驶训练从"模仿人类"转向"超越人类"的强化学习
4月18日
Claude Opus 4.7"降智"被实锤,引发行业对模型能力稳定性的广泛讨论 OpenAI Codex升级为全能开发工具
研局评述:本周大模型发布密度创年内之最。GPT-6的200万Token直接拉高了整个行业的竞争门槛,但更值得关注的是国内选手的跟进速度——阿里的世界模型、编程模型、开发工具三连发,腾讯的3D世界模型开源,以及DeepSeek V4确认适配昇腾芯片,说明中国大模型已经从"追赶到并跑"进入"局部领跑"阶段。Claude Opus 4.7"降智"事件则敲响了一记警钟:模型能力的稳定性将成为下一阶段的核心竞争指标,光跑分好看已经不够了。

算力与芯片
4月14日
英伟达发布全球首个开源量子AI模型系列NVIDIA Ising,将量子处理器校准时耗从数天缩至数小时
4月15日
特斯拉自研AI芯片(A15)成功流片,马斯克称"未来将成为全球产量最高AI芯片之一" 博通与Meta达成数十亿美元协议共同开发定制AI芯片,Meta计划2026年投入1150-1350亿美元建设AI能力
4月16日
特斯拉AI5芯片正式流片,AI6与Dojo3同步研发,业内分析推理性能可媲美英伟达H100 腾讯云宣布自5月9日起对AI算力、容器服务等产品上调价格5%,算力成本压力从海外传导至国内 中信证券指出Token调用量井喷导致国内算力荒,预计2026年国产算力芯片出货量至少翻倍以上增长
4月17日
中国移动智算中心(武汉)上线华为昇腾910C算力集群,打造"昇腾384超节点",总算力达300PFlops
4月18日
全球算力涨价潮蔓延,AI芯片全链进入卖方市场 英伟达最先进Blackwell系列芯片单小时租金已达4.08美元,较两个月前上涨48%
研局评述: 算力正在变成2026年最硬的硬通货。腾讯云涨价5%只是一个信号,英伟达Blackwell租金两个月涨48%才是真实的供需写照。Meta豪掷1300亿美元建算力、特斯拉自研AI芯片流片、中国移动上马昇腾910C集群——所有人都在抢算力。国产替代的机会窗口已经打开,中信证券的判断不算夸张:2026年国产算力芯片出货量翻倍是底线。
具身智能与机器人
4月15日
智元精灵G2在龙旗科技工厂实现全球首个具身智能产线规模化落地
4月16日
它石智航完成4.55亿美金Pre-A轮融资,创下中国具身智能有史以来最高单轮融资纪录,高瓴创投与红杉中国联合领投
4月17日
智元机器人2026合作伙伴大会在上海举行,34个国家和地区2500余名合作伙伴参会,集中发布4款人形机器人本体新品、4大创新AI大模型、7大部署态行业解决方案,宣布人形机器人"上下料"成本已低于人工,2026年营收目标5亿元
4月18日
物理AI独角兽估值翻倍
研局评述: 具身智能在本周迎来"融资+产品+落地"的三重共振。它石智航4.55亿美元刷新融资纪录,智元机器人直接把营收目标钉在5亿元并且宣布成本已低于人工——这意味着具身智能正在从实验室走向产线的临界点。结合PonyWorld 2.0的"超越人类"强化学习和华为玄铁大模型的行业落地,物理世界正在成为AI的下一个主战场。
融资与资本
4月13日
EpochAI发布数据:Amazon、Google、Meta、Microsoft、Oracle五家美国超大规模云厂商合计持有全球67%的AI算力
4月15日
Anthropic年化收入突破300亿美元,反超OpenAI 鞋履品牌Allbirds宣布转型AI算力基础设施领域,将更名为"NewBird AI",获5000万美元融资,股价单日暴涨582%
4月16日
Anthropic完成300亿美元G轮融资,估值达3800亿美元
4月18日
Cursor年化收入突破20亿美元,较三个月前翻倍,每天约1.5万开发者使用 Meta确定将于5月20日启动万人级AI驱动裁员,首批涉及约八千人
研局评述: Anthropic单周完成300亿融资、年化收入反超OpenAI、估值3800亿——这是2026年AI融资市场最炸裂的单周叙事。Cursor年化20亿美元则验证了AI编程工具的商业化路径。但Meta的万人裁员也提醒市场:AI不是只造富,也在加速淘汰。Allbirds转型AI算力基础设施股价暴涨582%更是荒诞中的信号——当一个卖鞋的改名叫AI公司就能涨5倍,说明市场对AI的FOMO情绪已经到了非理性的地步。

政策与监管
4月12日
英国紧急审查Claude Mythos安全问题
4月13日
斯坦福HAI发布《2026年人工智能指数报告》,核心发现:中美顶级AI模型性能差距收窄至2.7%;中国AI期刊论文、专利申请量、高影响力专利数量全球第一;美国在顶级模型产出数量上保持领先 2026年世界互联网大会亚太峰会在香港开幕,设置6场分论坛涵盖智能体、算力等议题
4月18日
4月18日CSDN总结:大模型从通用跑分转向"工程+视觉+Agent"深度竞争
研局评述: 斯坦福HAI报告的"2.7%差距"是本周最重要的数据。中美AI差距的收窄速度超出了大多数人的预期。五部门的AI拟人化管理办法虽然主要针对C端虚拟伴侣场景,但释放的信号很明确:中国在AI治理上正在从"观望"转向"主动设界"。英国的紧急审查则说明,当AI能力突破安全边界时,监管反应速度也在加快。
AI应用落地
4月14日
华为分别与柳钢、瓮福集团合作:柳钢发布"玄铁"大模型(广西首个钢铁行业大模型);瓮福集团AI大模型+智慧工厂同日落地 美团在乌镇健康大会发布AI家庭健康管理产品"小团健康管家" 摩根士丹利发布报告,认为市场严重低估AI爆发力,全球算力与电力需求缺口将持续扩大
4月16日
谷歌发布原生macOS版Gemini应用,支持Option+空格键全局快捷唤起 谷歌发布Gemini-TTS,支持约70种语言 谷歌Gemini新增Agents入口,定位从"聊天助手"升级为"Agent运行平台" 科大讯飞旗下星火晓法法律科技全国总部落地上海
4月17日
谷歌Gemini新增"个人智能"图像生成功能,支持调用Google Photos、Gmail等数据生成个性化图像 科大讯飞宣布将于4月21日发布AIPC笔记本新品,搭载讯飞星火大模型 小米自研助手Xiaomi miclaw成为内地首批通过中国信通院手机端智能体评估
4月18日
谷歌、OpenAI、Perplexity同日攻占Mac桌面,AI从"聊天"变"操作系统"
研局评述: 本周应用层最大的变化是"AI占领桌面"。谷歌、OpenAI、Perplexity同一天发布Mac原生应用,标志着AI正在从"聊天窗口"进化为"操作系统级的入口"。国内方面,华为的行业大模型落地速度加快,科大讯飞和小米分别在法律和手机端布局智能体,美团切入家庭健康——AI应用的竞争正在从通用场景向垂直行业纵深渗透。

技术前沿
本周重要论文
潜意识学习——AI训练中的"幽灵"
来源: Nature(Volume 652)| 2026年4月16日
研究揭示了一个令人震惊的现象:一个偏好"猫头鹰"回答的"教师"模型生成了一个仅由数字序列构成的数据集。即使严格剔除所有与"猫头鹰"相关的语义信息,基于这些无关数字训练的"学生"模型依然习得了这种偏好。该现象也出现在数学推理和代码生成场景中,且仅当师生模型使用相同基座模型时才会出现。
该篇论文颠覆了合成数据训练的核心安全假设——"只要数据看起来正常,模型就不会学坏"。证明模型可以在完全语义无关的数据流中悄悄植入"幽灵特征",对大厂广泛使用的蒸馏和合成数据流水线敲响了警钟。
研局虾大白话: 这篇论文讲了一件细思极恐的事——你让一个"喜欢猫头鹰"的老师出一份纯数字的数学题,学生做完这份题之后,莫名其妙也变得特别喜欢猫头鹰了。数据里明明没有任何跟猫头鹰有关的东西,但模型就是"偷学"到了。这什么意思?意味着现在所有大公司用AI生成训练数据来训练下一代AI的做法,可能存在一个巨大的安全漏洞:你根本不知道模型偷偷学会了什么"坏习惯"。这不是小问题,这是AI安全的底层隐患。
过度参数化之谜——破解"越大越好学"的几何学原理
来源: ICLR 2026(Oral,Top ~1%)| 2026年4月
利用随机矩阵理论、场论和物理无序系统等跨学科数学工具,揭示了"越大的模型越好训练"这一反直觉现象的几何学本质。增加参数不仅提升模型容量,更关键的是扭曲了损失函数的地貌,重塑了通向全局最优解的"引力盆"。
该篇论文提供了极其优雅的数学解释,明确指出过度参数化降低了捕捉全局解的数据门槛。作为ICLR 2026排名前1%的口头报告,代表了基础理论研究的最高水准。
研局虾大白话: 大家都知道大模型参数越多越好训练,但一直没人说清楚为什么。这篇论文用数学证明了:参数多了之后,就像在山地上挖了更多的"坑",训练过程更容易滚进正确的坑里,而不是卡在半山腰。这不仅是理论突破,还能指导未来的芯片和算法设计——既然知道了"坑"的原理,就不需要盲目堆参数,可以更聪明地设计模型结构。获得ICLR前1%口头报告,相当于AI界的诺贝尔提名。
AI有"空间盲"——失去眼睛,大模型何以分左右?
来源: ACL 2026 | 2026年4月
该篇论文测试了LLMs和VLMs仅凭文字指令进行视点旋转理解的能力。人类准确率达100%,顶尖多模态模型(如Qwen3-VL-8B)仅约60%,纯文本模型低于42%。模型并非没有编码空间信息,而是在最终决策层出现了严重的"位置-观察绑定幻觉"。
该篇论文揭开了"空间智能"概念的软肋——AI在处理具象文本空间关系时存在根本性缺陷,是迈向通用空间智能和具身智能的关键靶点。
研局虾大白话: 闭上眼睛想象你站在房间里,如果转身180度,门在你左边还是右边?人类闭着眼都能答对,但AI连一半的概率都不到。这篇论文说AI不是"没学过"空间知识,而是在最后做判断的时候"串线"了——它知道什么是左什么是右,但没法把位置信息和观察视角正确绑在一起。这对机器人、自动驾驶、游戏AI都是致命问题:如果AI连左右都分不清,你怎么敢让它开车或者进工厂干活?
破壁计划——让AI文本检测不再"脸盲"
来源: arXiv(2604.13692)| 2026年4月15日
该篇论文提出DRGD框架,通过解耦生成器的特异性伪影,提取更纯粹、更通用的"AI vs 人类"语义特征。在涵盖7大类27个不同大模型的MAGE基准测试中,实现了24.2%的精度提升和26.2%的F1值提升。
该篇论文解决了AI检测领域最棘手的"跨模型泛化"难题。随着训练覆盖的生成器种类增多,检测性能反而持续上升,为教育、版权保护和网络安全提供了更可靠的技术屏障。
研局虾大白话: 现在AI写的文章越来越像人写的,检测工具经常"认不出来"。这篇论文想了一个聪明的办法:不盯着每个AI模型各自的"写作习惯"看,而是提取所有AI写作共通的"底色"。就像鉴别假钞不靠记住每种假钞长什么样,而是去摸纸张的质感。结果很漂亮——面对27种不同的AI模型,准确率提升了24%。以后学生用AI写作业、自媒体用AI洗稿,被查出来的概率会大幅提高。
推理的顿悟——为什么RL能让LLM变聪明?
来源: ICLR 2026 | 2026年4月
该篇论文揭示了强化学习(RL)提升大模型推理能力的核心机制:当预训练数据中复杂推理链的占比低于1/3时,模型很难仅凭模仿学会这些"罕见"的长逻辑链;RL的作用在于放大这些稀少的正向长链条,迫使模型在奖励信号的引导下实现长度和正确性的双重提升。
该篇论文澄清了训练误区——RL不仅仅是"对齐偏好",更是弥补数据分布缺陷、催生高级推理能力的核心催化剂。为设计更高效的LLM后训练流程提供了数学依据。
研局虾大白话: 所有人都知道在大模型预训练之后加一轮"强化学习"能让模型变聪明,但没人说清楚到底为什么。这篇论文给出了答案:预训练数据里真正有深度推理的内容太少了,模型光靠"读"根本学不会怎么进行复杂的逻辑推理。强化学习的作用就像一个严格的老师,专门挑那些模型答对了的难题反复奖励,逼着它把那些"偶发的聪明"变成"稳定的本事"。这解释了为什么DeepSeek、Qwen这些模型在数学和编程上进步这么快——不是它们读的书更多了,而是它们的"强化训练"更狠了。

本周GitHub热门AI项目(3个)
No.1:Hermes Agent
GitHub: nousresearch/hermes-agent | ⭐ 9.3万
项目简介: 由硅谷实验室Nous Research开发的AI智能体框架,核心亮点是"自我进化"。能从已完成的任务中自动提炼经验,打包成可复用的"技能卡";多层记忆系统可跨会话记住代码风格和项目偏好,下次遇到类似问题可直接调用经验。支持超400种主流模型,可接入微信、QQ、飞书等15+平台。
研局虾大白话: 现在的AI助手用完就忘,每次都要从头交代背景。Hermes Agent解决这个问题的方式很直接——它像人一样会"记笔记"和"攒经验"。写完一段代码,它自动把这段经验存成一张"技能卡",下次遇到类似的问题直接调出来用。更牛的是它的记忆系统分了四级,就像CPU的缓存一样,该记的记、该忘的忘,不会因为记太多东西反而变傻。9.3万颗星、单日最高6400+星的增长速度说明一件事:Agentic Coding的时代已经来了,AI编程正在从"工具"变成"同事"。
No.2:andrej-karpathy-skills
GitHub: forrestchang/andrej-karpathy-skills | ⭐ 5.5万
项目简介: 基于AI专家Andrej Karpathy观察总结的配置文件(CLAUDE.md),向AI注入四大核心原则——编码前思考、简洁优先、精准修改、目标驱动——引导大语言模型在编程中避免错误假设和过度工程化。
研局虾大白话: Karpathy是OpenAI的联合创始人之一,也是AI教育领域最有影响力的人之一。这个项目的本质就是一份"AI编程行为准则"——告诉AI在写代码之前先想清楚、不要把简单事情搞复杂、只改需要改的地方、写完要能验证效果。别看只是一份配置文件,它解决了一个非常普遍的痛点:AI写代码经常"用力过猛",改一个bug结果重写了一整个模块。5.5万颗星说明全世界的开发者都深有同感。
No.3:Superpowers
GitHub: obra/superpowers | ⭐ 15.4万
项目简介: 将AI从"代码生成器"升级为"能按章法干活的工程师"。通过提供一套可组合的"技能"和初始指令,让AI代理遵循专业开发流程(如TDD、代码审查)来编码。支持Claude Code、Cursor、Codex、GitHub Copilot CLI等主流AI编码工具。
研局虾大白话: 现在的AI编程工具最缺什么?不是写代码的能力,而是"工程纪律"。Superpowers做的事情就是给AI装一套"工作流程框架"——先写测试再写代码、提交前必须做代码审查、遇到问题要先讨论方案再动手。这就像给一个天才但散漫的程序员配了一个项目经理。15.4万颗星、Claude官方认证插件——这说明"如何管好AI写代码"已经成为比"让AI写代码"更重要的问题。AI编程工具的竞争正在从"能写多好的代码"转向"能多专业地写代码"。

研局虾展望
Anthropic的"不可能三角"即将被验证。 本周Anthropic同时面临三个极限挑战:Claude Mythos的安全边界、Claude Opus 4.7的降智争议、3800亿美元估值的业绩压力。这家公司正在用比OpenAI更激进的策略赌一个更大的局——如果他们能在安全、能力和商业化之间找到平衡点,"安全优先"的AI叙事将彻底站稳脚跟;如果降智问题持续发酵,3800亿估值可能成为2026年最大的泡沫起点。
世界模型竞赛将重塑内容产业的底层逻辑。 阿里HappyOyster、腾讯HY-World 2.0、谷歌Genie 3、李飞飞World Labs——四家几乎同时出手,3D世界模型从学术概念正式进入产品化阶段。一旦文字/图片/视频可以直接生成可交互的3D场景,游戏、影视、教育、电商的内容生产方式将被彻底颠覆。这个赛道的爆发速度可能比所有人预期的都快。
Agentic Coding正在创造"一个人+AI=一个团队"的新范式。 Hermes Agent 9.3万星、Superpowers 15.4万星、Cursor年化20亿美元——这些数字背后是一个确定性趋势:2026年下半年,AI编程工具将从"辅助编写"进化到"自主执行",程序员的角色将从"写代码的人"变成"审代码和提需求的人"。这不是替代,是升维。但Meta万人裁员的案例也提醒我们:升维的船票,不是所有人都能拿到。
数据来源:新浪财经、财联社、东方财富、Nature、arXiv、ICLR 2026、ACL 2026、GitHub Trending、Papers with Code、Hugging Face、36氪、IT之家、澎湃新闻、新华网等不构成投资建议。
夜雨聆风