AI 日报 | 2026-04-20 星期一

今日关键词:Codex 超级 App / omi 开源穿戴 / Kimi K2.6 Code / Sora 倒计时
预计阅读:13 分钟
[头条] [快讯] [名人说] [要闻] [国内AI] [Trending] [值得关注] [AI Coding] [编辑说]
🔥 头条:OpenAI Codex 变「超级 App」——$100 Pro 订阅直指 Claude Max [深度跟进]
🛠AI Coding | OpenAI 官方发布 | VentureBeat 深度解读 | Thurrott 评测
4 月 19 日快讯已简报,今日头条补齐深度分析、$100 Pro 订阅细节与行业影响。

图片来源:Thurrott.com
概述:4 月 16 日,OpenAI 为 Codex 桌面版推送了「Codex for (almost) everything」大更新——这是自 2025 年 Codex 独立成产品以来最大规模的一次功能扩张。Codex 现在可以在 macOS 沙箱中用自己的鼠标和键盘操控任何应用(Computer Use,研究预览),内置 Chromium 浏览器支持对任意网页写自然语言注释,原生集成 90+ 插件(包括 Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Neon、Remotion、Render、Superpowers 等),用 gpt-image-1.5 生成和迭代图像,并新增「记忆」预览——Codex 会记住你的偏好、过往纠正和常用上下文。与此同时,OpenAI 推出 $100/月的 ChatGPT Pro 订阅,打包 5 倍 Codex 使用量,直接对标 Anthropic 的 Claude Max($100/月含 Opus 4.7)。官方数据称 Codex 目前每周有超过 300 万开发者使用。
深度分析:
为什么重要——AI Coding 赛道首次出现「IDE 边界消失」的产品形态。
过去两年 AI Coding 的主导范式是终端内嵌 Agent(Claude Code、Cursor、Windsurf),但所有工具都默认「在代码编辑器里」是工作的主场——要做 UI 对比就开浏览器、要管项目就开 Jira、要画设计图就开 Figma。OpenAI 这次把 Codex 桌面版推向「超级 App」方向:一个 Agent,直接操控整台 Mac 上的所有应用。Codex 是第一个把「IDE」「浏览器」「设计工具」「项目管理」合并成一个桌面 UI 的产品——而且是 OpenAI 从 ChatGPT 拓展出去,不是从 IDE 拓展出去的。
技术解读:Computer Use 依赖一个独立的虚拟工作空间(sandboxed virtual workspace)——Codex 的鼠标光标和你的光标解耦,多 Agent 可以并行操作不同应用而不抢焦点。in-app 浏览器用的是 Codex 自己嵌入的 Chromium,你可以在任何 DOM 节点上写「把这个按钮改成品牌蓝,再把间距减一半」,Agent 直接执行并 commit 到代码。图像生成用 gpt-image-1.5——和 ChatGPT 现在默认的图像模型同源,能够做产品概念图、前端 mock、游戏美术素材等。90+ 插件机制的核心是把 MCP Server + App Skill + 原生 API 调用三层统一——这和 Anthropic 的 MCP-only 路线不同,OpenAI 选择了更大生态、更松耦合的方案。
对开发者的影响:
• 对 Claude Code 用户:最直接的压力来自 $100 Pro 订阅。Codex Pro 给到 5 倍配额,相当于 Claude Max 价格对应更长 session、更多并行 Agent。如果你已经在用 Claude Max + Claude Code,这个月值得免费试一周 Codex Pro(首订有 7 天退款期)对比体感。 • 对 Cursor 用户:Cursor 3 的 Agents Window 也是多 Agent 并行,但不具备跨应用 Computer Use——Codex Desktop 在「PR review + 浏览器验证 + Figma 对标」这种跨工具链路上领先。 • 对插件生态开发者:OpenAI 放出 90+ 首发插件,是明显的生态先发信号——写插件的团队应该考虑先上 OpenAI 插件市场。
对行业的影响:这是 AI Coding 战局的范式转移时刻。Cursor 和 Windsurf 代表「把 AI 塞进 IDE」,Claude Code 代表「把 IDE 装进终端」,而 Codex Desktop 代表「把桌面变成 Agent 的工作台」——三条路线开始真正分野。搭配 OpenAI 的模型弹性(GPT-5.4 Thinking、GPT-Rosalind、即将到来的 GPT-5.5 Spud),OpenAI 正在用「一个 App 打 N 种场景」来构筑护城河。Anthropic 的回应已经隐约可见:Claude Code Week 14 推出了 CLI Computer Use 预览,Week 15 推出 Ultraplan 云端规划,都是在补桌面维度。
实操建议:
• 开发者:本周试一次 Codex Desktop 的 PR review + in-app 浏览器验证流程,感受「Agent 修完代码立刻看页面」的闭环 • 个人用户:如果你主要用 ChatGPT Plus 写代码,$100 Pro 订阅的性价比需要重新计算 • 插件作者:盯住 OpenAI 官方插件市场,写一个通用 MCP Server 是性价比最高的起步
一句话记住:AI Coding 赛道的下一个护城河不是模型,是「跨应用 Computer Use」。
⚡ 快讯速览
• 🛠AI Coding Claude Code v2.1.114 发布:修复 agent teams 权限对话崩溃 🔗 • 🧠大模型 Moonshot(月之暗面)Kimi K2.6 Code Preview 进 Beta [跟进]:万亿 MoE 编码专精 🔗 • 📦开源 GLM-5.1 登顶 SWE-Bench Pro:58.4 分压过 GPT-5.4 和 Opus 4.6,MIT 开源 🔗 • 📱应用 Sora 倒计时 6 天:App 4 月 26 日关停,API 9 月 24 日下线 🔗 • 🇨🇳国内AI DeepSeek V4 下旬发布窗口不变 [跟进]:1T 总参 37B 激活,昇腾测试中 🔗 • 📦开源 字节 DeerFlow v2 GitHub 突破 6.2 万星:长任务 SuperAgent harness 🔗 • 🛠AI Coding Codex CLI v0.121.0(4 月 15 日):marketplace 插件安装、TUI 反向搜索 🔗 • 📊数据 Q1 2026 AI 融资破 2420 亿美元:占全球 VC 投资 80% 🔗 • 🧠大模型 Anthropic Mythos 不公开 [跟进]:仅 50 家机构 gated 访问 🔗 • 📱应用 MIT Tech Review 明日发 AI 10 件要事:EmTech AI 大会现场首发 🔗 • 💰投融资 Parasail A 轮 3200 万:打造「AI SuperCloud」部署层 🔗 • 💰投融资 Artemis 出 stealth:AI 原生安全平台,累计 7000 万美元 🔗 • 📊数据 Gemini 3.1 Pro 并列 Intelligence Index:API 价格仅 GPT-5.4 的 1/3 🔗 • 📦开源 minimind 冲到 4.7 万星:2 小时训完 64M GPT,教学首选 🔗
🎙 名人说 & X/Twitter 热议
💬 Sam Altman —「Codex 现在可以操控你的电脑」(综合发布 tweet 概述)
4 月 16 日 Altman 在 X 和 OpenAI 官博同步官宣 Codex Desktop 大更新,定位从"编码助手"升级为"桌面超级 App"。官方博文重点点名 Atlassian Rovo、Microsoft Suite、Superpowers 等第三方插件——上次 OpenAI 主动给第三方品牌做推荐还是 GPTs 刚发布时。这是 OpenAI 从「一家做模型的公司」过渡到「一家做跨应用 Agent 平台的公司」的标志性节点。🔗 OpenAI 官博原文 | VentureBeat 解读
🔥 X/Twitter 热议:Pro 订阅值不值 & AI 订阅疲劳
Codex Pro 20、Claude Max 100、Copilot Pro 250。🔗 Next Web 报道
🔥 X/Twitter 热议:Sora 关停与 AI 视频迁移潮
Sora 3 月 24 日宣布 4 月 26 日关停,过去三周 #SoraGoodbye / #VideoMigration 话题积累。热帖主要集中在两个议题:(1) 创作者迁移路径——Veo 3.1(免费+4K)、Kling 3.0(风格化)、Runway Gen-4.5(电影级)的分流;(2) OpenAI 算力重新分配——多位独立分析师指出 Sora 退出释放的算力会直接流向 Codex/ChatGPT。🔗 Bloomberg: AI 视频工具竞争格局
📰 精选要闻
🧠 Kimi K2.6 Code Preview 进入 Beta——Moonshot 的编码反击 🔴必读

图片来源:Moonshot AI
Moonshot AI(月之暗面)4 月 13 日官方确认 Kimi K2.6 Code Preview 进入 Beta,基于万亿参数 MoE 架构(K2.5 为 1T 总参/32B 激活),下一代在代码生成和 Agent 能力上继续发力。K2.5 在 SWE-Bench Verified 上 76.8 分、MMMU-Pro 78.5 分、AIME 2025 达 96.1——K2.6 被官方定位为「next-gen code & agent model」,对齐 GPT-5.4 Thinking 和 Claude Opus 4.7 的目标市场。
背景:Artificial Analysis 年初评价 K2.5 为「OpenAI/Google/Anthropic 之外最强模型」。K2.6 Code Preview 瞄准一个越来越明确的细分市场——开源+编码专精+视觉理解+Agent 集群执行。它的 Agent Swarm 模式允许把复杂任务拆给多个动态实例化的子 Agent 并行处理,这和 OpenAI Codex 的 multi-Agent 路径寻址、字节 DeerFlow v2 的 sub-agent orchestration 都在同一条技术范式上收敛。
对国内开发者:如果你已经在 Claude Code + Qwen3.6-35B-A3B 的混合栈上,可以把 Kimi K2.6 Code Preview 加入本地/云端切换矩阵——尤其做长代码库重构、跨文件推理的场景。官方透露正式版本预计 5 月发布,这一个月是免费 Beta 窗口。
一句话记住:中国开源编码三巨头(Kimi K2.6、GLM-5.1、DeepSeek V4)本月将同台竞技。
📦 omi 开源 AI 穿戴冲上 GitHub——「可信第二大脑」的新叙事 🔴必读(个人 AI)

图片来源:BasedHardware/omi GitHub README
BasedHardware/omi 今日在 GitHub Trending 获得 +685 星,累计 11,132 星,4 月 19 日刚发布 v0.11.339——这是一款开源 AI 穿戴+软件生态,对标 Friend(89 的 necklace 设备 24 小时续航,另有 ESP32-S3 Omi Glass Dev Kit(带相机和音频);软件端:macOS/iOS/Android 桌面与移动应用,实时转录、对话摘要、屏幕监听、AI chat with memory。
为什么现在爆发: omi 解决了 Friend / Rabbit R1 / Humane AI Pin 的核心病根——不开源、数据不可控、厂商粘性过高。omi 全部 MIT 开源,179 位贡献者共建,用户可以:(1) 用自己的 OpenAI/Anthropic API Key;(2) 把数据存本地;(3) 自己改硬件固件。300,000+ 专业用户已经在用——这是开源 AI 硬件第一次突破「极客玩具」阈值。
对开发者的价值: Omi Glass Dev Kit 是整个生态中最值得关注的 SKU——ESP32-S3 + 相机模组 + 固件开源,你可以基于它搭个人 Agent、本地 RAG、会议助手、实时翻译眼镜。Dart/C/Python/Swift 多语言栈让前后端/硬件开发者都能切入。
一句话记住:开源 AI 穿戴的时代,是从「用户信任」开始的,不是从「算法先进」开始的。
📱 Sora 关停倒计时 6 天——AI 视频生态重构 🟡推荐
OpenAI 3 月 24 日宣布 Sora 应用 4 月 26 日关停、API 9 月 24 日下线。Sora 作为 2024 年 AI 视频的象征性产品,过去一年在 Kling(快手)、Runway Gen-4.5、Google Veo 3.1 的夹击下掉队——用户迁移到 Veo 3.1(4 月 2 日对所有 Google 账户免费,生成音画同步 4K 60fps)、Kling AI 3.0、Runway Gen-4.5。
OpenAI 的选择并不意外:视频生成赛道对算力要求极高(单次 4K 60fps 成本是文本的 100+ 倍),而 OpenAI 正把资源倾斜到 Codex/ChatGPT 等 B2B/B2C 粘性更强的产品。Sora 留下的市场空间正在被 Kling、Runway、Vidu 三家快速瓜分(Bloomberg 报道)。
对内容创作者:你的 Sora 工作流本周需要迁移。推荐路径:短广告/产品演示 → Veo 3.1(免费+4K);电影级镜头 → Runway Gen-4.5;风格化/动画 → Kling 3.0。
一句话记住:AI 视频赛道正式进入「Google+中国厂商」双寡头时代。
📦 字节 DeerFlow v2 — 开源长任务 SuperAgent harness 🟡推荐

图片来源:历史报道配图(DeerFlow 架构类比示意)
字节 bytedance/deer-flow 今日 GitHub 星数 62,730(+190),是今年 2 月 28 日登顶 GitHub Trending 的 SuperAgent 项目的 v2 完全重写。关键能力:sub-agent 并行编排(每个子 Agent 独立上下文+scoped 工具)、沙箱执行(本地或 Docker)、跨 session 持久记忆、Skills 系统(研究、报告、PPT、网页内容生成)、Telegram/Slack/Feishu/WeChat/WeCom 多通道集成,并且能通过 claude-to-deerflow skill 直接从 Claude Code 调用。
这是国内厂商在 AI Coding 领域的第一个开源 SuperAgent harness,和 OpenAI Codex Desktop(跨应用 Computer Use)、Claude Code(skill 注入)形成三条不同的 Agent 编排路径。DeerFlow 的优势:多 IM 通道(中国本地生态)、Feishu 深度集成、字节内部大规模验证过。
对国内开发者:如果你在做「长研究任务自动化」或「跨团队协作型 Agent」,DeerFlow v2 值得作为 Claude Code 的补充工具——一个跑本地编码、一个跑长任务研究。
🛠 Cursor 3 Composer 2 实战评测——200 tok/s 的生产力实验 🟡推荐
Cursor 3(4 月 2 日发布)的旗舰能力「Agents Window + Composer 2」已跑稳两周。Composer 2 在内部评测拿到 61.3 分(Composer 1.5 是 44.2 分,提升 39%),200+ tok/s 的推理速度依赖自研 GPU kernel。多 Agent 并行能力覆盖 local / cloud / remote SSH / git worktrees 四种环境,配 Design Mode(可视化 UI 迭代)和 cloud-to-local handoff(云端 Agent 跑完拉回本地)。
实战体感:Composer 2 在「大型代码库跨文件重构」和「React 组件 UI 调整」上已与 Opus 4.7 接近;但在「深度算法设计」和「自然语言需求澄清」仍稍逊于 Claude Code + Opus 4.7。价格上 Cursor Pro 仍是 100 的 Codex Pro 和 Claude Max,性价比突出。
对用户建议:Pro 日常使用 Cursor 3(Composer 2 基础任务足够),难题开 Claude Max / Codex Pro 的 Opus 4.7 / GPT-5.4 Thinking。两栈叠加最佳。
📊 GLM-5.1 SWE-Bench Pro 拿下 58.4——开源模型首次登顶编码 🔵了解
Z.ai(智谱 AI)4 月 7 日 MIT 协议开源 GLM-5.1 权重,SWE-Bench Pro 58.4 分登顶全球——压过 GPT-5.4(57.7)和 Claude Opus 4.6(57.3)。这是开源模型第一次在企业级编码评测上拿下头名(SWE-Bench Pro 是 Pro 级多仓库 benchmark,比 SWE-Bench Verified 更严格)。
背景:GLM-5.1 继续走「昇腾芯片训练+MIT 开源」路线,和 DeepSeek 形成「中国双开源编码巨头」格局。开发者可以在本地部署权重,或通过智谱 API 调用。对照 Opus 4.7(58.2 分,非官方)和 GPT-5.4 Thinking(58.9 分),差距在 1 分以内,但价格是 1/10。
对企业团队:如果你在评估「自建 AI Coding 基建」的 ROI,GLM-5.1 本地部署是当下最强选项。
🇨🇳 国内 AI 观察
Kimi K2.6 Code Preview vs GLM-5.1 vs DeepSeek V4——中国开源编码三巨头
4 月以来国内开源编码模型进入密集发布窗口。Moonshot Kimi K2.6 Code Preview(4 月 13 日 Beta)、Z.ai GLM-5.1(4 月 7 日开源,SWE-Bench Pro 58.4 登顶)、DeepSeek V4(4 月下旬)三家均锚定「开源+编码+Agent」的细分战场。
📊 对标参考:OpenAI GPT-5.4 Thinking(SWE-Bench Pro 58.9)、Claude Opus 4.7(非官方 58.2)——差距已进入 1 分内,但价格只有 1/10。关键不同:美国厂商护城河在「产品」(Codex Desktop、Claude Code),中国厂商护城河在「价格+开源+本地部署」。
对国内开发者:核心选型矩阵——GLM-5.1 做本地部署(MIT 开源)、Kimi K2.6 做云端 API(长上下文+Agent Swarm)、DeepSeek V4 等下旬发布再评估。
📈 GitHub Trending 精选
• Fincept-Corporation/FinceptTerminal ⭐ 6,484 (+1,254) Python[新上榜]今日总榜冠军的金融终端项目,AI 辅助市场分析、投资研究、经济数据探索,界面+数据一体化。• openai/openai-agents-python ⭐ 23,148 (+752) Python[持续上升]官方多 Agent 工作流框架,配合今日 Codex 桌面版大更新再度拉动增长。• BasedHardware/omi ⭐ 11,132 (+685) Dart[本周热门]开源 AI 穿戴硬件+软件生态,v0.11.339 于 4 月 19 日发布。详见要闻中「omi 开源 AI 穿戴」部分。• HKUDS/DeepTutor ⭐ 20,123 (+449) Python[新上榜]港大团队的 Agent-Native 个人化学习助手,教育垂直场景的 Agent 实践值得关注。• paperless-ngx/paperless-ngx ⭐ 38,851 (+393) Python[长青]社区文档管理系统,扫描/索引/归档,本地优先隐私方案,AI Agent 时代的「个人文档库」首选。• jingyaogong/minimind ⭐ 47,564 (+214) Python[持续上升]2 小时训完 64M 参数 GPT,小模型教学和工程入门的事实标准项目。• bytedance/deer-flow ⭐ 62,730 (+190) Python[持续上升]字节开源的长任务 SuperAgent harness。详见要闻中「字节 DeerFlow v2」部分。• openai/codex ⭐ 76,328 Rust[基础设施]Codex CLI(v0.121.0 于 4 月 15 日发布),Codex Desktop 的终端孪生。详见头条与 AI Coding 栏目。
🔭 值得关注
趋势追踪:
• [Day 1/7 新发现] OpenAI 超级 App 战略:Codex Desktop + Computer Use + 90+ 插件是 OpenAI 从「模型公司」转向「Agent 平台公司」的信号。7 天内追踪:插件生态扩张速度、Claude Code / Cursor 的同构回应、$100 Pro 订阅留存数据。 • [跟进] MCP 生态继续扩张:GitHub 官方 MCP Registry 已超 1200 个社区服务器;近期主流动作是生产化(stateless transport、企业审计、SSO auth)。 • [跟进] 开源编码模型 vs 闭源旗舰的 1 分鸿沟:Opus 4.7、GPT-5.4 Thinking、GLM-5.1、即将到来的 DeepSeek V4 和 Kimi K2.6 Code 在 SWE-Bench Pro 上差距已进入 1 分内。
本周预告:
• 4 月 21 日:MIT Technology Review 在 EmTech AI 大会现场揭晓「AI 领域 10 件要事」 • 4 月 26 日:Sora 应用正式关停 • 4 月下旬:DeepSeek V4 发布窗口
潜力动向:
• 开源 AI 穿戴的生态化:omi 11K+ 星是信号,但还没出现能复用 omi 硬件的第三方 App 生态——这是下一个 6 个月的关键观察点 • 个人 Agent 的「钱包」问题:Cursor + Claude Max + Codex Pro + Copilot Pro 已让单人月订阅超 $250——下一个赢家可能是「聚合订阅+智能路由」的元产品
🛠 AI Coding 工具动态
Claude Code
v2.1.114 发布(4 月 18 日):修复 agent teams 场景下权限对话崩溃的边缘 case。Week 15(4 月 6-10 日)的 Ultraplan 早期预览 继续推进——CLI 启动云端规划、Web 编辑器审阅评论、远程执行或拉回本地;Monitor 工具支持流式后台事件(Claude 能 tail 日志实时响应);/loop 不给 interval 参数时自行定节奏;/team-onboarding 把团队配置打包成可回放引导;/autofix-pr 终端触发 PR 自修复。
OpenAI Codex
Desktop v26.415(4 月 16 日):详见头条。CLI v0.121.0(4 月 15 日)支持从 GitHub 和本地目录安装 marketplace 插件、TUI 反向历史搜索、MCP 命名空间注册 + 并行调用。Realtime V2 WebRTC Voice 作为默认语音 session(v0.120.0)。
Cursor / Windsurf
Cursor 3 Composer 2 稳定运行(详见要闻评测)。Windsurf SWE-1.5 + SWE-grep 继续保持 950 tok/s 推理和 20 倍于 embedding 的检索速度。两家 Pro 都 $20/月,Cursor 赢多 Agent 编排,Windsurf 赢推理速度和 IDE 覆盖。
推荐 Prompt / 工作流
今日工作流:Codex Pro 首周试用法
1. 订阅 $100 Pro(7 天退款期)2. 任务 A:在 Codex Desktop 让 Agent 打开 VS Code,重构一个 React 组件,完成后打开 Chromium 浏览器 live reload 验证3. 任务 B:同样任务在 Claude Code 里完成4. 对比:单次上下文长度、Agent 步数、最终代码质量5. 决策:留 Codex Pro 还是 Claude Max,看你是「跨应用协作多」还是「纯代码重构多」MCP / Agent 生态
• 1200+ 社区 MCP Server 在官方 Registry 上架 • Streamable HTTP 无状态化 是 2026 MCP Roadmap 首要任务 • MCP Server Cards(标准化元数据 via .well-knownURL)即将落地• MCP Apps(交互式 UI 扩展)自 1 月进入生产
✍️ 编辑说
今天的真正信号不在 Codex 多了什么功能,而在 OpenAI 和 Anthropic 的战略分野已经清晰:OpenAI 押「超级 App + Computer Use + 插件生态」,Anthropic 守「CLI + skill + 专业开发者深度」。
我的判断:未来 6 个月两条路线会同时赢——Codex Desktop 吃掉 GPTs、ChatGPT Plus 和部分 Copilot 的市场;Claude Code + Opus 4.7 稳坐专业开发者工作台。被挤压的是中间地带:既不够深也不够广的产品。Cursor 和 Windsurf 要选边站。
实操建议:本月不要急升级 $100 订阅——用 7 天免费期对比 Codex Pro 和 Claude Max。AI 月费超 $200 那一刻,你是在为「工作流锁定」付费,而不是为模型能力付费。
💬 今天最有价值的是哪条?欢迎回复序号反馈。📌 工具换得再快,真正值得经营的是你自己的节奏。
夜雨聆风