今日摘要
• OpenAI(4/16)Codex 大改版:TechCrunch(4/16)称后台多代理可在 Mac并行跑任务、应用内浏览器与 memory预览等;插件口径写到 111 款;同日官稿主线为「Codex for (almost) everything」路线 (•̀ω•́)
• Anthropic Labs(4/17)Claude Design:TechCrunch(4/17)写由 Opus 4.7驱动,可导出 PDF / PPTX / URL并送进 Canva;同在「设计工具闯进生产力」叙事里:Mike Krieger(4/14)辞去 Figma董事,同日 The Information消息指 Opus 4.7或含更直接竞品能力
• Gemini Mac客户端:Google(4/15)通过 9to5Mac(4/15)等媒体释放 Option + Space一键唤起、菜单栏/Dock入口、原生 Swift实现;路线图侧继续叙事 Gemini将支撑升级后的 Siri / Apple Intelligence并于 WWDC 2026(6/8)有更多披露
• 分布式推理:arXiv 2604.15039(提交 4/16)给出 Prefill-as-a-Service,案例中称相对同质 PD与朴素异构基线可把吞吐抬升约 54% / 32%(摘要数字,以内测 1T hybrid设定为准);具身:Physical Intelligence(4/16)博客更新 π0.7,强调可循指令组合泛化
• 关停与投融资预期:OpenAI Help Center写明 Sora Web/App:2026-04-26、Sora API:2026-09-24关停节点;Bloomberg Odd Lots(4/18)约 Alex Imas的对谈把「这轮是否与前几次通用技术一样最终会回补就业」拉回辩论中心;TechCrunch(4/15)转述称 Anthropic拒绝约 800 亿美元量级入股要约(以彭博原稿为准)
产品与功能更新
1. OpenAI(4/16)
以「Codex for (almost) everything」为主线升级桌面端 Codex:强调可在后台并行部署多枚代理于 Mac、应用内浏览器、会话 memory与图像物料生成等;TechCrunch(4/16)列举的新增插件/Codex Skills 口径为 111 款,并把更新放入与 Anthropic Claude Code正面竞争的叙事里。
2. Anthropic Labs(4/17)
推出实验性 Claude Design:由 Claude Opus 4.7驱动,面向幻灯片、单页物料与原型速出;TechCrunch(4/17)写法是可导出 PDF/PPTX/URL,并可转入 Canva继续协作编辑,亦可从代码库/设计资产里抽 design system。
3. Google(4/15)
正式发布 Gemini for Mac:9to5Mac(4/15)描述为「100% native Swift」客户端,默认 Option+Space打开迷你对话、支持菜单栏与 Dock入口、可分窗/迷你窗与多组快捷;要求 macOS 15 Sequoia+并从 gemini.google/mac/分发。
4. DeepL(4/16)
发布语音到语音翻译套件并开放面向企业的 API:TechCrunch(4/16)称覆盖会议、移动端和「一线团队」群组场景,并预告 Zoom / Microsoft Teams相关扩展走早鸟计划;公司亦坦承当前栈仍是 ASR→翻译→TTS级联,未来想做端到端语音模型。
5. Luma(4/16)
与 Wonder Project、AWS联合宣布 Innovative Dreams制作服务公司与 Realtime Hybrid Filmmaking流程:定位把表演捕捉、虚拟制作、VFX与生成式 AI 贯穿前后期;首支全虚拟棚项目披露为 The Old Stories: Moses,并点名与 Luma Agents生产向工具协同。
前沿研究
1. arXiv 2604.15039(提交 4/16)
Prefill-as-a-Service:讨论在 hybrid-attention把 KVCache瘦身之后,如何把长上下文 prefill卸载到远端算力集群,再用商用以太网搬运 KV到本地 decode;摘要在内部 1T-parameter hybrid案例称相对「同质 PD」与「朴素异构」基线,吞吐可分别高约 54% / 32%,且跨机房带宽占用尚算温和。
2. Physical Intelligence(4/16)
π0.7:博客将其描述为更可被「语言子目标 / 视觉子目标 / 元数据标签」牵引的通用 VLA,示例包括少样本家务与跨本体泛化;同时提醒长程任务仍依赖分步指令,成败对提示工程高度敏感(官方视频与文字实验叙述,以站点披露为准)。
3. arXiv 2604.10780(提交 4/12)
LIDARLearn:开源 PyTorch一体库整合 55+套模型配置(覆盖 29类监督骨干、7类 SSL预训练与 5类 PEFT),并宣称配套 2200+自动化测试做端到端回归;代码指向 GitHub同名仓库,适用于点云分类/分割与表示学习对照实验。
4. arXiv 2604.14892(提交 4/16)
LLM Jury 医疗评分:在 300例中低收入国家真实住院病例上,让 3个前沿模型组成的陪审团给 3333条诊断打分(诊断、鉴别、推理、阴性治疗风险四维);摘要称未校准分系统性偏低,但序关系更贴近主专家面板,且严重安全错误概率低于独立人类复评面板,可用等渗回归校准拉近人类评分。
行业展望与社会影响
1. OpenAI Help Center(更新于周刊窗口)
明确 Sora Web/App将于 2026-04-26下线、Sora API将于 2026-09-24停用,并提醒尽量在关停前导出素材;同期产业评论将此举与「把算力重新投向编码与企业场景」联系在一起(详见 TechCrunch等对 Sora稿件)。
2. Bloomberg Odd Lots(4/18)
播客稿(Tracy Alloway / Joe Weisenthal)对话芝加哥大学 Alex Imas:主线是「AI 渗透劳动力的速度会不会让这一轮完全不像蒸汽机时代那样自动回补就业」,强调评估岗位风险要把 speed of deployment放进模型。
3. TechCrunch(4/16)
披露 Anthropic CPO Mike Krieger(4/14)辞去 Figma董事会席位,同日 The Information消息称 Opus 4.7或携带更直连的设计工具能力;稿件还把 IGV软件 ETF 年内约 -18%放进「SaaSpocalypse」叙事背景,并点名 Anthropic(4/15)据称拒绝 800 亿美元量级入股要约。
4. TechCrunch(4/4)
汇总 Anthropic向 Claude Code订阅用户发出的邮件:太平洋时间 4/4 正午起,订阅配额不再覆盖 OpenClaw等第三方 harness,需转用量包或 API按量付费;Boris Cherny在 X解释订阅模型并非为「超高频代理请求」设计,同时提到可为受影响用户提供退款路径。
5. 量子位(2026 年 4 月)
长文介绍深势 玻尔·跃迁实验室:强调 1800+仪器型号接入、自然语言调度试剂/设备、可视化流程编排与 AI-Ready实验记录,并把底层连接能力溯源到开源 Uni-Lab-OS栈,属于「干湿闭环」实验室改造叙事。
开源TOP项目
1. DeepGEMM
链接:https://github.com/deepseek-ai/DeepGEMM
DeepSeek开源的 FP8 GEMM核,主打细粒度缩放下的高效矩阵乘;GitHub 页面显示约 ⭐6.7k(以页面为准),适合做大模型训练/推理算子层的对照实验。
2. android-reverse-engineering-skill
链接:https://github.com/SimoneAvogadro/android-reverse-engineering-skill
面向 Claude Code的 Android逆向 Skill,强调接口抽取与业务逻辑还原自动化;约 ⭐3.6k,偏安全审计与移动端取证工作流。
3. LIDARLearn
链接:https://github.com/said-ohamouddou/LIDARLearn
与 arXiv 2604.10780同步发布的点云深度学习一体化库,文档化 55+配置与统计检验脚本;体量仍在早期(约 ⭐121),胜在论文—代码闭环齐全。
4. OpenHands
链接:https://github.com/OpenHands/OpenHands
AI-driven development开源栈,整合可插拔模型与工具接口做端到端编程代理;GitHub 页面显示约 ⭐71.5k,适合与商业 IDE插件对照读工程化边界。
社媒分享
1. X / Hacker News
上将 Anthropic(4/4)起的 OpenClaw计费调整与 Peter Steinberger入职 OpenAI时间线并置讨论:高频观点分成「基础设施必须定价」与「开源 harness遭平台政策挤压」两派。
2. 产品设计类时间线
把 Anthropic Labs(4/17)Claude Design与 Google(4/15)Gemini Mac放在一起比较:议题从「Figma会不会被模型公司绕开」延伸到更具体的 design token与 组件库如何喂给代理上下文。
3. Bloomberg Odd Lots(4/18)
听众社区把 Alex Imas访谈剪成短视频二创,争议点集中在「complementarity vs crowd-out」经验证据是否足以支持强政策结论。
4. 中文开发者社区
对 量子位关于 玻尔・跃迁实验室一文的吐槽/兴奋点分化:一边关注 1800+仪器数字,一边追问与 ELN/LIMS传统部署的真实迁移成本。
5. Reddit / X
实测帖比较 Gemini Mac与浏览器版常驻占用的差异:常见反馈围绕 Option+Space是否符合肌肉记忆、以及与 Spotlight类快捷是否冲突。
6. 安全审计向讨论
复盘 TechCrunch(4/4)后 OpenClaw付费墙对 CI里跑 Claude Code的团队影响:议题包括「是否全面改走 API预算」与「如何把 third-party harness用量重新折进采购合同」。
夜雨聆风