
本期看点:OpenAI Codex 推出六款角色插件与 Sites/批注;NVIDIA 发布 Nemotron 3 Ultra 550B NVFP4;解读 Claude Code 动态工作流;Google 开源 Agent Skills 仓库;Agent-Reach:给 AI Agent 装上全网阅读。
编辑:TimLi
🔥 本周热点
OpenAI 发布 Codex 角色插件、Sites 与批注:六款知识工作插件覆盖分析、销售到投行 - 6 月 2 日更新,Codex 周活已超 500 万,非开发者占新用户 40%。推出数据分析、创意制作、销售、产品设计、公开股票投资、投资银行六款角色插件,打包 62 个应用与 110 项技能,直连 Snowflake、Figma、Salesforce、HubSpot 等团队现有工具。Sites 可把文档、表格或财务模型转为带 URL 的交互式网站;批注支持选中导航栏、图表或论点段落就地修改。插件全套餐可用,Sites 面向 Business/Enterprise 预览。
https://openai.com/zh-Hans-CN/index/codex-for-every-role-tool-workflow/

NVIDIA 发布 Nemotron 3 Ultra 550B NVFP4:1M 上下文 LatentMoE 旗舰,55B 激活参数 - 6 月 4 日上线 Hugging Face,550B 总参、55B 激活,Mamba-2 + MoE + Attention 混合架构,带 Multi-Token Prediction 与可配置 reasoning 模式。NVFP4 量化在 Terminal Bench 2.1、GDPVal 等 Agent 基准接近 BF16,最低 4×GB200/B200 或 8×H100 可部署。支持 11 种语言、1M token 上下文,面向复杂多步 Agent、长文分析与高 stakes RAG,OpenMDW-1.1 许可。
https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Anthropic Institute 发文论递归式自我改进:合并代码 80% 由 Claude 撰写 - 系统梳理 AI 加速 AI 开发的证据与风险。Anthropic 内部数据显示,2026 年 5 月合并进代码库的变更超 80% 由 Claude 生成,工程师日均合并量为 2024 年约 8 倍;AI 可靠完成的单次任务时长约每 4 个月翻倍。Claude 在执行明确定义的研究实验上已能匹敌熟练研究员,但在「该研究什么问题」等开放式判断上仍有明显差距。文章探讨未来模型自主设计并训练下一代系统的「闭环」场景,强调失控风险与治理紧迫性。
https://www.anthropic.com/institute/recursive-self-improvement

Google 推出 Gemini Enterprise Agentic RAG:Sufficient Context Agent 迭代检索,准确率最高 +34% - Google Research 与 Cloud 联合发布的多 Agent RAG 框架,6 月 5 日公开。编排器、规划器、查询改写器与搜索扇出代理分工协作,核心创新是 Sufficient Context Agent:对照检索片段、中间草稿与原始问题逐项检查,信息不足则生成缺失项反馈并触发新一轮检索,避免首轮落空就猜答案或放弃。FramesQA 上较 Vanilla RAG 准确率最高提升 34%,四语料库干扰下仍达 90.1%,延迟与单库版本基本持平。已在 Gemini Enterprise Agent Platform 预览。
https://research.google/blog/unlocking-dependable-responses-with-gemini-enterprise-agent-platforms-agentic-rag/

📖 教程与分享
Anthropic Thariq 解读 Claude Code 动态工作流:为每个任务现场生成专属 Harness - Claude Code 团队成员 Thariq 6 月 2 日的深度解读。动态工作流让 Claude 现场写 JavaScript 编排脚本,通过 spawn 等 API 协调子代理,可按任务选模型、开独立 worktree。默认 Harness 规划与执行共用一个上下文,长时并行或对抗式验证容易撑爆;工作流把中间结果留在脚本变量里,适合研究、安全分析、Code Review 等非纯编码场景。触发方式:直接要求创建 workflow,或 /effort ultracode 让 Claude 自动决策,用 /workflows 查看运行状态。
https://x.com/trq212/status/2061907337154367865

🔧 模型与工具
PM Skills Marketplace 开源:68 项 PM 技能 + 42 条命令工作流,覆盖发现到上市全链路 - 产品经理专用 Agent Skills 市场,9 个插件把 Teresa Torres、Marty Cagan 等框架写进技能文件。/discover 串联头脑风暴→假设识别→优先级→实验设计,/write-prd、/plan-launch、/north-star 等命令覆盖战略到增长。Claude Cowork 可从 GitHub 一键装全市场,Claude Code 用 claude plugin marketplace add phuryn/pm-skills 按需选装,也兼容 Codex CLI。MIT 许可,解决通用 AI 只会吐段落、缺少 PM 方法论结构的问题。
https://github.com/phuryn/pm-skills

Google 开源 Agent Skills 仓库:Gemini API、BigQuery、GKE 等 GCP 产品技能一键安装 - Google 官方出品的 Agent Skills 合集,遵循 agentskills.io 规范。npx skills add google/skills 可选装 Gemini API/Interactions API、Managed Agents API、Skill Registry,以及 AlloyDB、BigQuery、Cloud Run、Cloud SQL、Firebase、GKE 基础技能,附带 GCP 入网认证、网络可观测性 Recipe 和 Well-Architected Framework 六大维度指南。仓库仍在积极开发,Apache 2.0 许可,适合在 Agent 工作流里标准化调用 Google Cloud。
https://github.com/google/skills

Agent-Reach 开源:一条 CLI 给 AI Agent 装上全网阅读,Twitter/小红书/B 站零 API 费 - 24k+ 星,让 Claude Code、Cursor、OpenClaw 等能读 Twitter/X、Reddit、YouTube、B 站、小红书、GitHub、微信公众号和任意网页。基于 yt-dlp、Jina Reader、rdt-cli 等开源组件拼装,Cookie 仅存本地。YouTube 字幕、RSS、网页阅读开箱即用;Twitter 搜索、B 站、小红书需简单配置代理或登录。agent-reach doctor 一条命令诊断各平台连通性,兼容所有能跑命令行的 Agent,MIT 许可。
https://github.com/Panniantong/Agent-Reach

Career-Ops 开源:Claude Code 驱动的 AI 求职流水线,六维评分 + ATS 简历批量生成 - 把 AI 编码 CLI 变成求职指挥中心:粘贴职位 URL 自动六块评估(岗位匹配、薪酬调研、面试 STAR 故事库等),A-F 十维加权打分,低于 4.0/5 强烈不建议海投。Playwright 扫描 Greenhouse/Ashby/Lever 等 45+ 公司招聘页,claude -p 并行批量处理,Go Bubble Tea TUI 管理 pipeline,输出 Space Grotesk 设计的 ATS 友好 PDF。强调过滤而非群发,系统从不自动提交申请,MIT 许可。
https://github.com/santifer/career-ops

Headroom 开源:Agent 上下文压缩层,工具输出 token 减少 60–95% 答案不变 - 在工具输出、日志、RAG 分块进入 LLM 前做本地压缩。提供 Python/TS 库、headroom proxy 零改代码代理、headroom wrap claude|codex|cursor 一键包裹,以及 headroom_compress/headroom_retrieve MCP 工具。ContentRouter 按类型选 SmartCrusher(JSON)、CodeCompressor(AST)或 Kompress-base 文本模型;CCR 可逆压缩把原文存本地,LLM 需要时再检索。跨 Agent 共享记忆,headroom learn 从失败会话写回 CLAUDE.md,Apache 2.0。
https://github.com/chopratejas/headroom

OpenAI 开源 Codex 插件示例仓库:Figma、Notion、Expo 等完整插件样板 - Codex 插件规范的官方示例合集,每个插件在 plugins/<name>/.codex-plugin/plugin.json 声明,可附带 skills、.mcp.json、agents、commands、hooks。精选示例覆盖 Figma Code to Canvas/Code Connect、Notion 知识管理、build-ios/macos/web-apps 全栈开发、Expo EAS 工作流、Netlify 部署、Remotion 视频和 Google Slides。配合角色插件发布,适合团队参考结构自建或改造内部工作流插件。
https://github.com/openai/plugins


夜雨聆风