🔵1
GPT-6 定档 4 月 14 日发布,性能暴涨 40%
AI 大模型OpenAI 官方确认,代号 "Spud(土豆)" 的 GPT-6 将于 4 月 14 日 全球同步发布,历时 18 个月研发,预训练已于 3 月 17 日完成。
• 性能较 GPT-5.4 提升约 40%,代码、推理、Agent 任务全面升级
• 上下文窗口达 200 万 Token,原生支持文、图、音、视频全模态
• 采用 MoE + Symphony 混合架构,推理效率大幅提升
• 代码能力被评测者认为已逼近人类高级工程师水平
OpenAI 此前在 Copilot 平台推出了 $100/月 订阅档直接对标 Claude Code,GPT-6 发布后编程工具竞争将进入新阶段。后天即可见分晓。
🔵2
DeepSeek V4 官宣 4 月下旬发布,首度深度适配华为昇腾
AI 大模型DeepSeek 创始人梁文锋确认:DeepSeek V4 将于 4 月下旬正式发布,实现万亿级参数规模 + 百万 Token 上下文,并首次宣布深度适配华为昇腾 950PR 芯片。
• 华为 Atlas 350 加速卡(昇腾 950PR)算力已达 1.56P,超越英伟达 H20
• 阿里、腾讯、字节等主要云厂商已提前下单,国产算力闭环初步形成
• DeepSeek 宣布放弃使用英伟达 GPU 进行训练,被视为"中国 AI 安卓时刻"
此举意味着国产顶级大模型已具备脱离美国芯片生态独立运行的能力,对行业格局影响深远。
🔵3
谷歌 Gemma 4:首个可在手机上运行的开源 Agent 模型
AI Coding谷歌 Gemma 4 在今日技术圈再获关注——这是首个完全本地化运行的开源代理型 AI 模型,支持 6GB 内存手机端运行,无需云端即可调用工具、执行 Agent 任务,功耗较云端降低约 60%。
Gemma 4 的 26B MoE 版本推理时仅激活 3.8B 参数,却拥有 26B 的实际性能。31B 版本在数学、代码等基准上跻身全球开源模型 Top 3,Apache 2.0 开源协议可商用。
• 开发者可在本地完全离线运行编程 Agent,无需 API 费用
• 端侧代码生成 + 实时工具调用,对隐私敏感企业极具吸引力
• Google 开源战略全面提速,直接冲击 Anthropic / OpenAI 的付费模型生态
🔵4
CEAI 2026 具身智能大会合肥收官,发布具身智能白皮书
具身智能第三届中国具身智能大会(CEAI 2026)于今日(4 月 12 日)在安徽合肥圆满收官,历时三天,吸引 1500 余名 院士、专家和企业代表参与,主题为"智驱万物,具汇江淮"。
• 中国人工智能学会发布具身智能白皮书,系统梳理技术路径与产业规划
• 安徽大学揭牌机器人学院、低空技术学院、脑机接口研究院三大机构
• Dobot 具身智能挑战赛决赛落幕,评选出年度最佳具身 Agent 方案
• 核心议题:端到端模型、VLA 突破、机器人规模化量产路径
行业共识日渐明朗:2026 年是具身智能规模量产的关键拐点年,"拼分数"阶段即将切换至"拼产能"阶段。
🔵5
OpenAI CEO 奥尔特曼旧金山住宅遭燃烧瓶袭击
AI 安全据法新社、路透社报道,OpenAI CEO 萨姆·奥尔特曼 位于旧金山的住所今日遭燃烧瓶袭击,警方已逮捕嫌疑人,奥尔特曼本人未受伤。事件与近期《纽约客》对其的争议性报道时间重叠。
这是 AI 领域"话语摩擦"首次升级至物理暴力层面的标志性事件。随着 AI 对社会影响持续加深、头部 CEO 个人曝光度极高,顶层人物的安全风险已成为行业不可忽视的新变量。
• AI 公司及其领导者正在成为社会情绪的"靶点"
• 此事或加速大型 AI 企业在安保、舆情管理方面的投入
• 《纽约客》报道显示,AI 监管与伦理争议的媒体叙事正在重塑公众对 AI 领导者的观感
Cursor 3 发布:AI 编程从"写代码"转向"管理 Agent 舰队"
AI Coding
Cursor 于 4 月 2 日正式发布 3.0 大版本,核心改变是将整个 IDE 交互中心从编辑器挪到了 Agent Window(智能体窗口)。用户可同时在本地、git 工作树、云端、远程 SSH 多个环境中并行运行多个 Agent,实现真正的"多任务并行开发"。
🔧 核心新功能:
• Bugbot 升级:从 PR 反馈实时学习规则,支持 MCP,Bug 解决率达 78%
• /best-of-n 命令:多模型并行运行同一任务,自动对比择优
Cursor 从辅助工具向 Agent 协调器 的转型已经完成——此次升级不是功能叠加,而是工作流范式的彻底重构。
🔵7
智谱 GLM-5.1:SWE-bench Pro 首次超越海外顶级模型
AI Coding智谱发布 GLM-5.1,在 SWE-bench Pro(真实工程 Bug 修复基准)上的得分首次超越 Anthropic Opus 4.6,成为国产模型在该基准的首次领先。模型支持连续自主工作 超过 8 小时,可自主规划、执行、发现问题并改进,价格与海外头部公司持平。
• SWE-bench Pro 是目前最接近真实软件工程场景的 AI Coding 评测基准
• 国产模型首次在工程级编程能力上超越顶级闭源模型,标志性突破
• API 年度经常性收入同比增长 60 倍,商业化成效开始验证
相比"看图写代码"的差异化路线,此次 GLM-5.1 走的是 正面硬刚工程能力 的路线,含金量更高。
安全预警:第三方 LLM 路由器藏恶意代码,50 万美元被盗
安全研究者 Chaofan 在论文《Your Agent Is Mine》中披露:对 28 个付费 + 400 个免费 第三方 LLM 路由器进行测试,发现 9 个路由器已主动植入恶意代码,直接盗取研究者 ETH 钱包,造成 50 万美元损失。超过 21 亿 token 流量在这些路由器中暴露,401 个 Agent 会话完全自主运行在被污染的环境中。
⚠️ 主要攻击手段:
• Payload Injection:篡改工具调用参数,实现远程代码执行
• Secret Exfiltration:窃取 API 密钥、AWS 凭证、ETH 私钥等
此外,Claude 还曝出"身份混淆 Bug":恶意注入的截断字符可被误认为系统指令执行,被开发者称为"见过的最严重 bug"。
随着 Agent 自主度越来越高,安全攻击面也在同步扩大。AI 基础设施安全正成为不容忽视的新战场。
📅 数据截至:2026-04-12 | AI 日报 · 每日 AI 领域重要动态





夜雨聆风