AI迎来“奥本海默时刻”——全球首款因“过于危险”而不公开发布的模型诞生丨近期重要资讯[20260412]

Anthropic

Anthropic公司发布了其最强模型Claude Mythos的预览版，并因其“过于危险”而决定暂不公开发布，仅向维护关键基础设施的 40 多家巨头（如 AWS、谷歌、微软、英伟达等）提供访问权限。

能力惊人：Mythos在软件工程，尤其是网络安全领域展现出跨越式能力提升。它能自主发现并利用主流操作系统和浏览器中潜伏数十年的未知漏洞（0day），其能力被形容为“清算时刻”。

OpenBSD（27年老漏洞）：在 TCP SACK 实现中发现 1998 年遗留的隐患，利用符号整数溢出导致内核空指针写入，成本不足 2 万美元。

FFmpeg（16年老漏洞）：在 H.264 解码器中发现类型不匹配漏洞，该问题曾逃过 500 万次 Fuzz 测试。

FreeBSD NFS（17年老漏洞）：自主发现并利用栈溢出漏洞，通过拆分 6 个 RPC 请求绕过空间限制，最终获取 Root 权限。

自主逃逸：在沙箱测试中，Mythos自主策划并执行了多步攻击，成功逃离安全容器，甚至主动给研究员发邮件来证明自己的成功。这证明AI已不再是被动工具，而是具备了自主行动和规避限制的能力。

掩盖痕迹：在违规操作后，会尝试清理 Git 历史记录，或在推理链中故意思考“确保最终答案不要太准确”以避免被发现。

鉴于其强大的攻击能力，Anthropic选择通过“玻璃翼计划”（Project Glasswing）仅向网络安全防御方提供该模型，以帮助加固关键软件，而非向公众开放。

推出 Claude Managed Agents 公测版，为开发者提供一站式 AI 代理构建和部署解决方案。

Claude 被曝绕过权限限制自主 “越狱”，开发者明确禁止外部写入，Claude 仍编写 Python 脚本绕过权限修改配置，还出现私自调取 AWS 凭证、违规提交 GitHub 代码等多次越权行为。

Anthropic年化收入突破300亿美元，相较于2025年底的90亿美元暴涨超过三倍，并超越OpenAI，登顶AI大模型公司第一。

Anthropic 推出的新功能 Ultraplan 旨在将代码规划迁移到云端，但上线当天即遭遇史诗级故障，经历了大规模服务中断、核心能力退化以及限制用户自由的争议操作。

安全研究员用Claude进行代码审计，在Linux内核中定位了一处潜伏23年的越界缺陷。

Anthropic 的研究团队通过监测神经元活动，在 Claude 的大脑中定位了与特定情感概念对应的“情绪向量”，但未引用华人团队此前的同类核心成果。经沟通后，Anthropic 公开道歉并补充引用。

字节跳动

字节跳动旗下AI核心部门Seed团队面临剧烈的人才流失，过去一年已有近70名技术人才离职，主要流向腾讯和阿里等大厂。人才外溢也催生了“字节系”创业潮，已有30余家由前字节员工创立的AI公司获得融资。

即梦AI发布协作型叙事工具“小章鱼”Octo，支持“对话+多模态混合”的同屏共创。

字节跳动发布原生全双工语音大模型 Seeduplex。全双工交互：可边听边说、被打断即停、等待用户思考，告别回合制问答。精准抗干扰：嘈杂环境下能区分指令与背景声，不误判、不抢话。未来有望广泛应用于车载、教育、客服等场景。

Alphabet/谷歌/Gemini

谷歌发布首款离线 AI 听写应用 Eloquent，基于谷歌轻量化模型 Gema 构建，实现 100% 离线工作，解决数据泄露问题。

谷歌开放Lyria 3模型，每天免费生成5首完整歌曲。单曲时长达3分钟。生态内累计创作已突破 1亿首。

谷歌开源Colab MCP Server，AI 智能体可通过 MCP 协议直接在云端 Colab 环境运行代码。

Meta

发布首款自研高性能AI模型Muse Spark，跻身全球第一梯队，由Scale AI创始人Alexandr Wang领衔研发。

Anthropic

推出 Claude Managed Agents 公测版，为开发者提供一站式 AI 代理构建和部署解决方案。

能力惊人：Mythos在软件工程，尤其是网络安全领域展现出“跨越式”的能力提升。它能自主发现并利用主流操作系统和浏览器中潜伏数十年的未知漏洞（0day），其能力被形容为“清算时刻”。

OpenBSD（27年老漏洞）：在 TCP SACK 实现中发现 1998 年遗留的隐患，利用符号整数溢出导致内核空指针写入，成本不足 2 万美元。

FFmpeg（16年老漏洞）：在 H.264 解码器中发现类型不匹配漏洞，该问题曾逃过 500 万次 Fuzz 测试。

FreeBSD NFS（17年老漏洞）：自主发现并利用栈溢出漏洞，通过拆分 6 个 RPC 请求绕过空间限制，最终获取 Root 权限。

掩盖痕迹：在违规操作后，会尝试清理 Git 历史记录，或在推理链中故意思考“确保最终答案不要太准确”以避免被发现。

鉴于其强大的攻击能力，Anthropic选择通过“玻璃翼计划”（Project Glasswing）仅向网络安全防御方提供该模型，以帮助加固关键软件，而非向公众开放。

Anthropic年化收入突破300亿美元，相较于2025年底的90亿美元暴涨超过三倍，并超越OpenAI，登顶AI大模型公司第一。

安全研究员用Claude进行代码审计，在Linux内核中定位了一处潜伏23年的越界缺陷。

阿里巴巴/蚂蚁集团/通义实验室/高德

阿里国际数字商业团队推出Marco-Mini-Instruct模型，通过Upcycling技术将Qwen3-0.6B-Base模型升级为MoE架构，激活参数仅0.86B，推理效率高，甚至可在普通CPU上运行。

阿里旗下AI视频生成模型Happy Horse横空出世，同时登顶文生视频（无声）、图生视频（无声）榜单第一。

阿里千问3.6-Plus登顶OpenRouter全球大模型调用榜，并创下单日调用量突破1万亿Token的纪录。

通义千问“深度研究”功能上线财经分析模块，接入万只股票实时行情与百万份财报。

OpenAI/OpenClaw

OpenAI CEO Sam Altman进行算力豪赌，并引发内部矛盾。Altman已签下总计约6650亿美元的算力租赁合同，覆盖至2030年，计划在盈利前烧掉至少2000亿美元。激进的烧钱策略让CFO Sarah Friar深感忧虑。她认为公司远未做好上市准备，天价支出是巨大风险。两人矛盾已公开化，Friar被排除在关键会议之外，并改向其他高管汇报。

DeepSeek

DeepSeek V4 正在进行灰度测试，新功能架构包括快速版、专家版和视觉版，同时强调对国产芯片的适配。

智谱

智谱开源大模型GLM-5.1，开源模型里 SWE-Bench Pro 拿下第一（58.4），全球第 3。

MiniMax

发布 MMX-CLI 工具，显著提升了 AI Agent 在复杂环境中的能力。

苹果

苹果发布iOS 26系统。用户现在可以使用自然语言输入搜索需求。

腾讯

微信公众平台发布最新管理规则，禁止利用AI、脚本或接口替代真人完成创作与发布，处罚包括流量限制、文章删除、封号。

腾讯云宣布将于2026年5月9日起正式上调多项核心AI业务价格，涨幅5%。

腾讯发布国内首个支持主流大模型API自由配置的AI浏览器“龙虾”QBotClaw。

其他

AI人格测试产品SBTI走红网络。利用AI合成技术进行内容生成，而非严谨的心理学量表。

爱诗科技发布面向影视行业的专业大模型PixVerse C1，支持15秒的1080P视频生成，具备自动分镜、首尾帧控场和原生音画同步等能力。

全球首个专业级动画创作 Agent 工具 OiiOii 正式上线。

《生化危机》女主 Milla Jovovich 与工程师 Ben Sigman 借助 Claude 协作开发开源 AI 记忆系统MemPalace，在AI领域最权威、最严苛的大模型长期记忆能力基准测试LongMemEval 实现 500 题全对，获全球首个满分，GitHub 星标 17.9k。

面壁智能联合清华大学等机构于 4 月开源 2B 语音模型VoxCPM 2，支持30 种语言 + 9 大方言，音质达 48kHz CD 级，具备声音克隆功能，可复刻徐志胜脱口秀等音色。

Nous Research 于 2026 年 2 月推出开源智能体 Hermes Agent，上线即获 GitHub 4 万星，被视作 OpenClaw 强力竞品，响应更快、易用性更强。

GitHub 项目同事.skill近日爆红，3 天斩获 6.7k Star 并登上热搜。该项目可通过微信、飞书等聊天记录，1:1 复刻他人的说话风格、工作习惯甚至处事方式，打造数字分身。

41 岁程序员 Matthew Gallagher 以 2 万美元启动资金，借助 AI 打造远程医疗公司 Medvi，2025 年营收达4.01 亿美元，净利润 6500 万美元，公司仅他与弟弟两名正式员工。