AI 日报 | 2026-04-20 星期一

今日关键词：Codex 超级 App / omi 开源穿戴 / Kimi K2.6 Code / Sora 倒计时

预计阅读：13 分钟

[头条] [快讯] [名人说] [要闻] [国内AI] [Trending] [值得关注] [AI Coding] [编辑说]

🔥 头条：OpenAI Codex 变「超级 App」——$100 Pro 订阅直指 Claude Max [深度跟进]

🛠AI Coding | OpenAI 官方发布 | VentureBeat 深度解读 | Thurrott 评测

4 月 19 日快讯已简报，今日头条补齐深度分析、$100 Pro 订阅细节与行业影响。

图片来源：Thurrott.com

概述：4 月 16 日，OpenAI 为 Codex 桌面版推送了「Codex for (almost) everything」大更新——这是自 2025 年 Codex 独立成产品以来最大规模的一次功能扩张。Codex 现在可以在 macOS 沙箱中用自己的鼠标和键盘操控任何应用（Computer Use，研究预览），内置 Chromium 浏览器支持对任意网页写自然语言注释，原生集成 90+ 插件（包括 Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Neon、Remotion、Render、Superpowers 等），用 gpt-image-1.5 生成和迭代图像，并新增「记忆」预览——Codex 会记住你的偏好、过往纠正和常用上下文。与此同时，OpenAI 推出 $100/月的 ChatGPT Pro 订阅，打包 5 倍 Codex 使用量，直接对标 Anthropic 的 Claude Max（$100/月含 Opus 4.7）。官方数据称 Codex 目前每周有超过 300 万开发者使用。

深度分析：

为什么重要——AI Coding 赛道首次出现「IDE 边界消失」的产品形态。

过去两年 AI Coding 的主导范式是终端内嵌 Agent（Claude Code、Cursor、Windsurf），但所有工具都默认「在代码编辑器里」是工作的主场——要做 UI 对比就开浏览器、要管项目就开 Jira、要画设计图就开 Figma。OpenAI 这次把 Codex 桌面版推向「超级 App」方向：一个 Agent，直接操控整台 Mac 上的所有应用。Codex 是第一个把「IDE」「浏览器」「设计工具」「项目管理」合并成一个桌面 UI 的产品——而且是 OpenAI 从 ChatGPT 拓展出去，不是从 IDE 拓展出去的。

技术解读：Computer Use 依赖一个独立的虚拟工作空间（sandboxed virtual workspace）——Codex 的鼠标光标和你的光标解耦，多 Agent 可以并行操作不同应用而不抢焦点。in-app 浏览器用的是 Codex 自己嵌入的 Chromium，你可以在任何 DOM 节点上写「把这个按钮改成品牌蓝，再把间距减一半」，Agent 直接执行并 commit 到代码。图像生成用 gpt-image-1.5——和 ChatGPT 现在默认的图像模型同源，能够做产品概念图、前端 mock、游戏美术素材等。90+ 插件机制的核心是把 MCP Server + App Skill + 原生 API 调用三层统一——这和 Anthropic 的 MCP-only 路线不同，OpenAI 选择了更大生态、更松耦合的方案。

对开发者的影响：

• 对 Claude Code 用户：最直接的压力来自 $100 Pro 订阅。Codex Pro 给到 5 倍配额，相当于 Claude Max 价格对应更长 session、更多并行 Agent。如果你已经在用 Claude Max + Claude Code，这个月值得免费试一周 Codex Pro（首订有 7 天退款期）对比体感。
• 对 Cursor 用户：Cursor 3 的 Agents Window 也是多 Agent 并行，但不具备跨应用 Computer Use——Codex Desktop 在「PR review + 浏览器验证 + Figma 对标」这种跨工具链路上领先。
• 对插件生态开发者：OpenAI 放出 90+ 首发插件，是明显的生态先发信号——写插件的团队应该考虑先上 OpenAI 插件市场。

对行业的影响：这是 AI Coding 战局的范式转移时刻。Cursor 和 Windsurf 代表「把 AI 塞进 IDE」，Claude Code 代表「把 IDE 装进终端」，而 Codex Desktop 代表「把桌面变成 Agent 的工作台」——三条路线开始真正分野。搭配 OpenAI 的模型弹性（GPT-5.4 Thinking、GPT-Rosalind、即将到来的 GPT-5.5 Spud），OpenAI 正在用「一个 App 打 N 种场景」来构筑护城河。Anthropic 的回应已经隐约可见：Claude Code Week 14 推出了 CLI Computer Use 预览，Week 15 推出 Ultraplan 云端规划，都是在补桌面维度。

实操建议：

• 开发者：本周试一次 Codex Desktop 的 PR review + in-app 浏览器验证流程，感受「Agent 修完代码立刻看页面」的闭环
• 个人用户：如果你主要用 ChatGPT Plus 写代码，$100 Pro 订阅的性价比需要重新计算
• 插件作者：盯住 OpenAI 官方插件市场，写一个通用 MCP Server 是性价比最高的起步

一句话记住：AI Coding 赛道的下一个护城河不是模型，是「跨应用 Computer Use」。

⚡ 快讯速览

• 🛠AI Coding Claude Code v2.1.114 发布：修复 agent teams 权限对话崩溃 🔗
• 🧠大模型 Moonshot（月之暗面）Kimi K2.6 Code Preview 进 Beta [跟进]：万亿 MoE 编码专精 🔗
• 📦开源 GLM-5.1 登顶 SWE-Bench Pro：58.4 分压过 GPT-5.4 和 Opus 4.6，MIT 开源 🔗
• 📱应用 Sora 倒计时 6 天：App 4 月 26 日关停，API 9 月 24 日下线 🔗
• 🇨🇳国内AI DeepSeek V4 下旬发布窗口不变 [跟进]：1T 总参 37B 激活，昇腾测试中 🔗
• 📦开源 字节 DeerFlow v2 GitHub 突破 6.2 万星：长任务 SuperAgent harness 🔗
• 🛠AI Coding Codex CLI v0.121.0（4 月 15 日）：marketplace 插件安装、TUI 反向搜索 🔗
• 📊数据 Q1 2026 AI 融资破 2420 亿美元：占全球 VC 投资 80% 🔗
• 🧠大模型 Anthropic Mythos 不公开 [跟进]：仅 50 家机构 gated 访问 🔗
• 📱应用 MIT Tech Review 明日发 AI 10 件要事：EmTech AI 大会现场首发 🔗
• 💰投融资 Parasail A 轮 3200 万：打造「AI SuperCloud」部署层 🔗
• 💰投融资 Artemis 出 stealth：AI 原生安全平台，累计 7000 万美元 🔗
• 📊数据 Gemini 3.1 Pro 并列 Intelligence Index：API 价格仅 GPT-5.4 的 1/3 🔗
• 📦开源 minimind 冲到 4.7 万星：2 小时训完 64M GPT，教学首选 🔗

🎙 名人说 & X/Twitter 热议

💬 Sam Altman —「Codex 现在可以操控你的电脑」（综合发布 tweet 概述）

4 月 16 日 Altman 在 X 和 OpenAI 官博同步官宣 Codex Desktop 大更新，定位从"编码助手"升级为"桌面超级 App"。官方博文重点点名 Atlassian Rovo、Microsoft Suite、Superpowers 等第三方插件——上次 OpenAI 主动给第三方品牌做推荐还是 GPTs 刚发布时。这是 OpenAI 从「一家做模型的公司」过渡到「一家做跨应用 Agent 平台的公司」的标志性节点。🔗 OpenAI 官博原文 | VentureBeat 解读

🔥 X/Twitter 热议：Pro 订阅值不值 & AI 订阅疲劳

Codex Pro 20、Claude Max 100、Copilot Pro 250。🔗 Next Web 报道

🔥 X/Twitter 热议：Sora 关停与 AI 视频迁移潮

Sora 3 月 24 日宣布 4 月 26 日关停，过去三周 #SoraGoodbye / #VideoMigration 话题积累。热帖主要集中在两个议题：(1) 创作者迁移路径——Veo 3.1（免费+4K）、Kling 3.0（风格化）、Runway Gen-4.5（电影级）的分流；(2) OpenAI 算力重新分配——多位独立分析师指出 Sora 退出释放的算力会直接流向 Codex/ChatGPT。🔗 Bloomberg: AI 视频工具竞争格局

📰 精选要闻

🧠 Kimi K2.6 Code Preview 进入 Beta——Moonshot 的编码反击 🔴必读

图片来源：Moonshot AI

Moonshot AI（月之暗面）4 月 13 日官方确认 Kimi K2.6 Code Preview 进入 Beta，基于万亿参数 MoE 架构（K2.5 为 1T 总参/32B 激活），下一代在代码生成和 Agent 能力上继续发力。K2.5 在 SWE-Bench Verified 上 76.8 分、MMMU-Pro 78.5 分、AIME 2025 达 96.1——K2.6 被官方定位为「next-gen code & agent model」，对齐 GPT-5.4 Thinking 和 Claude Opus 4.7 的目标市场。

背景：Artificial Analysis 年初评价 K2.5 为「OpenAI/Google/Anthropic 之外最强模型」。K2.6 Code Preview 瞄准一个越来越明确的细分市场——开源+编码专精+视觉理解+Agent 集群执行。它的 Agent Swarm 模式允许把复杂任务拆给多个动态实例化的子 Agent 并行处理，这和 OpenAI Codex 的 multi-Agent 路径寻址、字节 DeerFlow v2 的 sub-agent orchestration 都在同一条技术范式上收敛。

对国内开发者：如果你已经在 Claude Code + Qwen3.6-35B-A3B 的混合栈上，可以把 Kimi K2.6 Code Preview 加入本地/云端切换矩阵——尤其做长代码库重构、跨文件推理的场景。官方透露正式版本预计 5 月发布，这一个月是免费 Beta 窗口。

一句话记住：中国开源编码三巨头（Kimi K2.6、GLM-5.1、DeepSeek V4）本月将同台竞技。

📦 omi 开源 AI 穿戴冲上 GitHub——「可信第二大脑」的新叙事 🔴必读（个人 AI）

图片来源：BasedHardware/omi GitHub README

BasedHardware/omi 今日在 GitHub Trending 获得 +685 星，累计 11,132 星，4 月 19 日刚发布 v0.11.339——这是一款开源 AI 穿戴+软件生态，对标 Friend（89 的 necklace 设备 24 小时续航，另有 ESP32-S3 Omi Glass Dev Kit（带相机和音频）；软件端：macOS/iOS/Android 桌面与移动应用，实时转录、对话摘要、屏幕监听、AI chat with memory。

为什么现在爆发： omi 解决了 Friend / Rabbit R1 / Humane AI Pin 的核心病根——不开源、数据不可控、厂商粘性过高。omi 全部 MIT 开源，179 位贡献者共建，用户可以：(1) 用自己的 OpenAI/Anthropic API Key；(2) 把数据存本地；(3) 自己改硬件固件。300,000+ 专业用户已经在用——这是开源 AI 硬件第一次突破「极客玩具」阈值。

对开发者的价值： Omi Glass Dev Kit 是整个生态中最值得关注的 SKU——ESP32-S3 + 相机模组 + 固件开源，你可以基于它搭个人 Agent、本地 RAG、会议助手、实时翻译眼镜。Dart/C/Python/Swift 多语言栈让前后端/硬件开发者都能切入。

一句话记住：开源 AI 穿戴的时代，是从「用户信任」开始的，不是从「算法先进」开始的。

📱 Sora 关停倒计时 6 天——AI 视频生态重构 🟡推荐

OpenAI 3 月 24 日宣布 Sora 应用 4 月 26 日关停、API 9 月 24 日下线。Sora 作为 2024 年 AI 视频的象征性产品，过去一年在 Kling（快手）、Runway Gen-4.5、Google Veo 3.1 的夹击下掉队——用户迁移到 Veo 3.1（4 月 2 日对所有 Google 账户免费，生成音画同步 4K 60fps）、Kling AI 3.0、Runway Gen-4.5。

OpenAI 的选择并不意外：视频生成赛道对算力要求极高（单次 4K 60fps 成本是文本的 100+ 倍），而 OpenAI 正把资源倾斜到 Codex/ChatGPT 等 B2B/B2C 粘性更强的产品。Sora 留下的市场空间正在被 Kling、Runway、Vidu 三家快速瓜分（Bloomberg 报道）。

对内容创作者：你的 Sora 工作流本周需要迁移。推荐路径：短广告/产品演示 → Veo 3.1（免费+4K）；电影级镜头 → Runway Gen-4.5；风格化/动画 → Kling 3.0。

一句话记住：AI 视频赛道正式进入「Google+中国厂商」双寡头时代。

📦 字节 DeerFlow v2 — 开源长任务 SuperAgent harness 🟡推荐

图片来源：历史报道配图（DeerFlow 架构类比示意）

字节 bytedance/deer-flow 今日 GitHub 星数 62,730（+190），是今年 2 月 28 日登顶 GitHub Trending 的 SuperAgent 项目的 v2 完全重写。关键能力：sub-agent 并行编排（每个子 Agent 独立上下文+scoped 工具）、沙箱执行（本地或 Docker）、跨 session 持久记忆、Skills 系统（研究、报告、PPT、网页内容生成）、Telegram/Slack/Feishu/WeChat/WeCom 多通道集成，并且能通过 claude-to-deerflow skill 直接从 Claude Code 调用。

这是国内厂商在 AI Coding 领域的第一个开源 SuperAgent harness，和 OpenAI Codex Desktop（跨应用 Computer Use）、Claude Code（skill 注入）形成三条不同的 Agent 编排路径。DeerFlow 的优势：多 IM 通道（中国本地生态）、Feishu 深度集成、字节内部大规模验证过。

对国内开发者：如果你在做「长研究任务自动化」或「跨团队协作型 Agent」，DeerFlow v2 值得作为 Claude Code 的补充工具——一个跑本地编码、一个跑长任务研究。

🛠 Cursor 3 Composer 2 实战评测——200 tok/s 的生产力实验 🟡推荐

Cursor 3（4 月 2 日发布）的旗舰能力「Agents Window + Composer 2」已跑稳两周。Composer 2 在内部评测拿到 61.3 分（Composer 1.5 是 44.2 分，提升 39%），200+ tok/s 的推理速度依赖自研 GPU kernel。多 Agent 并行能力覆盖 local / cloud / remote SSH / git worktrees 四种环境，配 Design Mode（可视化 UI 迭代）和 cloud-to-local handoff（云端 Agent 跑完拉回本地）。

实战体感：Composer 2 在「大型代码库跨文件重构」和「React 组件 UI 调整」上已与 Opus 4.7 接近；但在「深度算法设计」和「自然语言需求澄清」仍稍逊于 Claude Code + Opus 4.7。价格上 Cursor Pro 仍是 100 的 Codex Pro 和 Claude Max，性价比突出。

对用户建议：Pro 日常使用 Cursor 3（Composer 2 基础任务足够），难题开 Claude Max / Codex Pro 的 Opus 4.7 / GPT-5.4 Thinking。两栈叠加最佳。

📊 GLM-5.1 SWE-Bench Pro 拿下 58.4——开源模型首次登顶编码 🔵了解

Z.ai（智谱 AI）4 月 7 日 MIT 协议开源 GLM-5.1 权重，SWE-Bench Pro 58.4 分登顶全球——压过 GPT-5.4（57.7）和 Claude Opus 4.6（57.3）。这是开源模型第一次在企业级编码评测上拿下头名（SWE-Bench Pro 是 Pro 级多仓库 benchmark，比 SWE-Bench Verified 更严格）。

背景：GLM-5.1 继续走「昇腾芯片训练+MIT 开源」路线，和 DeepSeek 形成「中国双开源编码巨头」格局。开发者可以在本地部署权重，或通过智谱 API 调用。对照 Opus 4.7（58.2 分，非官方）和 GPT-5.4 Thinking（58.9 分），差距在 1 分以内，但价格是 1/10。

对企业团队：如果你在评估「自建 AI Coding 基建」的 ROI，GLM-5.1 本地部署是当下最强选项。

🇨🇳 国内 AI 观察

Kimi K2.6 Code Preview vs GLM-5.1 vs DeepSeek V4——中国开源编码三巨头

4 月以来国内开源编码模型进入密集发布窗口。Moonshot Kimi K2.6 Code Preview（4 月 13 日 Beta）、Z.ai GLM-5.1（4 月 7 日开源，SWE-Bench Pro 58.4 登顶）、DeepSeek V4（4 月下旬）三家均锚定「开源+编码+Agent」的细分战场。

📊 对标参考：OpenAI GPT-5.4 Thinking（SWE-Bench Pro 58.9）、Claude Opus 4.7（非官方 58.2）——差距已进入 1 分内，但价格只有 1/10。关键不同：美国厂商护城河在「产品」（Codex Desktop、Claude Code），中国厂商护城河在「价格+开源+本地部署」。

对国内开发者：核心选型矩阵——GLM-5.1 做本地部署（MIT 开源）、Kimi K2.6 做云端 API（长上下文+Agent Swarm）、DeepSeek V4 等下旬发布再评估。

📈 GitHub Trending 精选

• Fincept-Corporation/FinceptTerminal ⭐ 6,484 (+1,254) Python [新上榜]今日总榜冠军的金融终端项目，AI 辅助市场分析、投资研究、经济数据探索，界面+数据一体化。
• openai/openai-agents-python ⭐ 23,148 (+752) Python [持续上升]官方多 Agent 工作流框架，配合今日 Codex 桌面版大更新再度拉动增长。
• BasedHardware/omi ⭐ 11,132 (+685) Dart [本周热门]开源 AI 穿戴硬件+软件生态，v0.11.339 于 4 月 19 日发布。详见要闻中「omi 开源 AI 穿戴」部分。
• HKUDS/DeepTutor ⭐ 20,123 (+449) Python [新上榜]港大团队的 Agent-Native 个人化学习助手，教育垂直场景的 Agent 实践值得关注。
• paperless-ngx/paperless-ngx ⭐ 38,851 (+393) Python [长青]社区文档管理系统，扫描/索引/归档，本地优先隐私方案，AI Agent 时代的「个人文档库」首选。
• jingyaogong/minimind ⭐ 47,564 (+214) Python [持续上升]2 小时训完 64M 参数 GPT，小模型教学和工程入门的事实标准项目。
• bytedance/deer-flow ⭐ 62,730 (+190) Python [持续上升]字节开源的长任务 SuperAgent harness。详见要闻中「字节 DeerFlow v2」部分。
• openai/codex ⭐ 76,328 Rust [基础设施]Codex CLI（v0.121.0 于 4 月 15 日发布），Codex Desktop 的终端孪生。详见头条与 AI Coding 栏目。

🔭 值得关注

趋势追踪：

• [Day 1/7 新发现] OpenAI 超级 App 战略：Codex Desktop + Computer Use + 90+ 插件是 OpenAI 从「模型公司」转向「Agent 平台公司」的信号。7 天内追踪：插件生态扩张速度、Claude Code / Cursor 的同构回应、$100 Pro 订阅留存数据。
• [跟进] MCP 生态继续扩张：GitHub 官方 MCP Registry 已超 1200 个社区服务器；近期主流动作是生产化（stateless transport、企业审计、SSO auth）。
• [跟进] 开源编码模型 vs 闭源旗舰的 1 分鸿沟：Opus 4.7、GPT-5.4 Thinking、GLM-5.1、即将到来的 DeepSeek V4 和 Kimi K2.6 Code 在 SWE-Bench Pro 上差距已进入 1 分内。

本周预告：

• 4 月 21 日：MIT Technology Review 在 EmTech AI 大会现场揭晓「AI 领域 10 件要事」
• 4 月 26 日：Sora 应用正式关停
• 4 月下旬：DeepSeek V4 发布窗口

潜力动向：

• 开源 AI 穿戴的生态化：omi 11K+ 星是信号，但还没出现能复用 omi 硬件的第三方 App 生态——这是下一个 6 个月的关键观察点
• 个人 Agent 的「钱包」问题：Cursor + Claude Max + Codex Pro + Copilot Pro 已让单人月订阅超 $250——下一个赢家可能是「聚合订阅+智能路由」的元产品

🛠 AI Coding 工具动态

Claude Code

v2.1.114 发布（4 月 18 日）：修复 agent teams 场景下权限对话崩溃的边缘 case。Week 15（4 月 6-10 日）的 Ultraplan 早期预览 继续推进——CLI 启动云端规划、Web 编辑器审阅评论、远程执行或拉回本地；Monitor 工具支持流式后台事件（Claude 能 tail 日志实时响应）；/loop 不给 interval 参数时自行定节奏；/team-onboarding 把团队配置打包成可回放引导；/autofix-pr 终端触发 PR 自修复。

OpenAI Codex

Desktop v26.415（4 月 16 日）：详见头条。CLI v0.121.0（4 月 15 日）支持从 GitHub 和本地目录安装 marketplace 插件、TUI 反向历史搜索、MCP 命名空间注册 + 并行调用。Realtime V2 WebRTC Voice 作为默认语音 session（v0.120.0）。

Cursor / Windsurf

Cursor 3 Composer 2 稳定运行（详见要闻评测）。Windsurf SWE-1.5 + SWE-grep 继续保持 950 tok/s 推理和 20 倍于 embedding 的检索速度。两家 Pro 都 $20/月，Cursor 赢多 Agent 编排，Windsurf 赢推理速度和 IDE 覆盖。

MCP / Agent 生态

• 1200+ 社区 MCP Server 在官方 Registry 上架
• Streamable HTTP 无状态化 是 2026 MCP Roadmap 首要任务
• MCP Server Cards（标准化元数据 via .well-known URL）即将落地
• MCP Apps（交互式 UI 扩展）自 1 月进入生产

✍️ 编辑说

今天的真正信号不在 Codex 多了什么功能，而在 OpenAI 和 Anthropic 的战略分野已经清晰：OpenAI 押「超级 App + Computer Use + 插件生态」，Anthropic 守「CLI + skill + 专业开发者深度」。

我的判断：未来 6 个月两条路线会同时赢——Codex Desktop 吃掉 GPTs、ChatGPT Plus 和部分 Copilot 的市场；Claude Code + Opus 4.7 稳坐专业开发者工作台。被挤压的是中间地带：既不够深也不够广的产品。Cursor 和 Windsurf 要选边站。

实操建议：本月不要急升级 $100 订阅——用 7 天免费期对比 Codex Pro 和 Claude Max。AI 月费超 $200 那一刻，你是在为「工作流锁定」付费，而不是为模型能力付费。

💬 今天最有价值的是哪条？欢迎回复序号反馈。📌 工具换得再快，真正值得经营的是你自己的节奏。