一、本周头条
1. Claude Code 生态集中爆发:Skills 最佳实践 + Cowork 产品指南 + AI 原生工程组织
Anthropic 本周集中发布了 Claude Code 生态的系列深度文章,标志着从"能用"到"会用"的成熟期到来:
- Skills 使用经验:Anthropic 内部已有数百个 Skills 在生产使用中。核心洞见——Skills 不是"就是 Markdown 文件",而是包含脚本、资产、数据的文件夹,Agent 可以发现、探索和操作。最有效的 Skills 善用配置选项和文件夹结构。
- Dynamic Workflows 实战指南:详细讲解了如何用动态工作流替代手工编排。典型 prompt 示例——让 AI 挖掘 Slack 六个月 incidents 找 root cause、用对抗性多 Agent 审视商业计划、批量简历筛选并交叉验证。
- AI 原生工程组织:Claude Code 团队工程总监 Fiona Fung 分享了组织变革——规划从 roadmap 转向 JIT,context gathering 从找人转向问 Claude,代码审查瓶颈取代了编码瓶颈。"写代码、写测试、重构不再是瓶颈,验证和安全才是。"
这些文章合在一起描绘了 AI 辅助开发的新常态:工具已足够强大,关键是组织流程和使用模式的适配。
2. MiniMax M3 大模型:MSA 架构 + 1M 上下文,国产首个全面超越 GPT-5.5
MiniMax 发布 M3 大模型,采用自研稀疏注意力架构(MSA),实现 1M token 上下文窗口下每 token 计算量仅为上代模型的十分之一。在权威评测中超越 GPT-5.5 和 Gemini 3.1 Pro,展现出强大的长线程自主规划能力,并选择全面开源。
同周发布的还有英伟达 Cosmos3——全球首款全开源全模态物理 AI 大模型,具备视觉推理、世界生成与动作预测能力,联合行业巨头成立"宇宙联盟"。两款开源模型的接连发布显示开源阵营在旗舰模型层面正加速追赶闭源。
3. AI Agent 进入"超级助手"时代:千问、微信、扣子三路并进
本周国内 AI Agent 生态出现重要拐点:
- 千问全面开放第三方 Agent 与 Skill:瑞幸、东航等首批接入,用户可在千问 APP 内调用品牌服务,千问战略升级为"超级 Agent"个人助手
- 微信 A2A 助手:与华为、小米、荣耀、OPPO 深度合作,手机 AI 可直接调动微信功能,从"孤岛互联"走向"端云协同"
- 扣子 3.0 正式上线:支持"多人 + 多 Agent"协同作业,跨端同步和本地生态融合
与此同时,快手上线 AI 购物助手、月之暗面开启 Kimi Work(本地 Agent)内测。Agent 正从概念验证快速进入用户日常。
二、资讯速览
大厂动态
Anthropic / Claude
- 发布论文"Making Claude a Chemist"——Claude 开始进入化学领域,能读取 NMR 光谱辅助结构鉴定
- Claude Cowork 产品使用指南发布(6/5)
- Anthropic 内部如何用 Claude 实现自助数据分析
OpenAI
- 推出 Sites 功能:对话生成可托管的交互式网站,零代码创建
- 升级 ChatGPT 记忆系统(Dreaming V3):算力降至 1/5,免费用户可用
- "AI 上岗"发布会:六大行业 Codex 工作流插件,非程序员用户占比达 20%
- 现场演示"无 App"Agentic 手机操作系统原型,计划 2027H1 量产
- 官宣重启机器人业务,招募全栈工程师
- Gemma 4 12B 发布:无编码器多模态架构、首款中型音频输入模型、16GB 笔记本可跑
- Google AI Edge Gallery 登陆 Mac,端侧 AI 直接跑 12B 多模态
- Google Colab CLI 发布:本地终端直连远程 GPU/TPU 运行时
- AI Edge Eloquent:离线语音听写 + Gemma 4 12B 文本润色
字节跳动
- 扣子 3.0 正式上线
- 豆包计划 6 月下旬上线付费版(三档订阅),Q3 联动电商引流
- 开源视频编辑框架 Bernini:"先理解再动手"的语义规划 + 视觉渲染
阿里巴巴
- 千问全面开放第三方 Agent/Skill
- Qwen3.7-Plus 发布:GUI + CLI 双向通吃,11 小时自主闭环开发 APP
- NBA Chat 上线:首个官方大模型体育问答
腾讯
- 文档发布「人机双写」能力,接入 WorkBuddy
- 云 ADP 4.0 发布 Claw 模式
- 与宁德时代拟巨额参投 DeepSeek(估值 4000 亿元)
开源 & 研究
- Ideogram 4.0 开源:93 亿参数,DesignArena 全球第四,文字渲染能力大幅提升
- 阶跃星辰 Step 3.7 Flash 开源(上周发布本周扩散):196B MoE 架构,原生多模态
- Krea 2 LoRA 全面开放:免费用户可训练自定义风格 LoRA
产品 & 工具
- xAI 发布 Grok Imagine Video 1.5:图片秒变视频,API 开放预览
- GitHub Copilot 正式上线按量计费(AI 点数扣费)
- Kimi Work 内测:面向知识工作者的通用本地 Agent
国内动态
- DeepSeek 首轮融资估值或达 4000 亿元
- 小红书治理超 120 万个 AI 托管账号、处置 18 万篇 AI 造假笔记
- 快手 AI 购物助手上线,补齐货架电商智能导购
- 微信 AI 智能体原型曝光,主打应用内任务处理
三、深度洞察
1. 从"会写代码"到"如何组织工程"——AI 原生组织的真正挑战
Anthropic 工程总监 Fiona Fung 分享了一个关键观察:当 agentic coding 成为默认工作方式后,瓶颈从"写代码"转移到了"验证代码"。Claude Code 团队的应对:
- 规划从六个月 roadmap 变为 JIT,因为速度太快计划追不上变化
- "谁写的这段代码"不再有意义(所有 PR 都有 AI 参与),新问题是"你真正需要知道什么"
- 代码审查成为最大瓶颈——生成快但验证慢
这跟我们在实际工作中的感受完全一致。对工程领导者的启示:不要只关注"用 AI 加速开发",更要思考如何重新设计验证、审查和上线流程。否则 AI 生成的代码只会堆积在 PR 队列里。
2. AI Agent 的"App Store 时刻"正在中国率先到来
千问开放 Agent/Skill、微信 A2A、扣子 3.0 三者叠加,本周可能是中国 AI Agent 生态的拐点周:
- 千问 = Agent 分发平台(类似 App Store,品牌入驻提供服务)
- 微信 A2A = 操作系统级管道(手机原生 AI 直接调用微信能力)
- 扣子 3.0 = Agent IDE(多人多 Agent 协作开发)
三条路线分别对应"分发"、"管道"、"开发"三个层面,合在一起就是一个完整的 Agent 生态。值得注意的是,OpenAI 的"无 App 手机"演示和千问的"超级 Agent"在理念上完全一致——AI 即操作系统,App 退化为 Skill。
3. 记忆系统成为 AI 产品差异化的新战场
OpenAI 升级 ChatGPT 记忆(Dreaming V3,算力降 80%),千问开放个性化 Skill,豆包准备付费版……各家都在押注同一个方向:持久化的个性化体验。
背后的逻辑:当模型能力趋同时(都能写代码、生成图片),用户粘性来自"它了解我"。记忆系统的好坏直接决定 retention。OpenAI 特别强调解决了"记忆过时"和"记忆不准"两大痛点——这说明第一代记忆系统已经暴露了足够多的问题,需要架构级重写。
四、值得阅读
- A harness for every task: dynamic workflows in Claude Code — 动态工作流的实战 prompt 模式和最佳实践,从简历筛选到对抗性验证
- Running an AI-native engineering org — Claude Code 团队如何重塑工程流程,对所有技术管理者必读
- Making Claude a chemist — AI 进入湿实验室的第一步:NMR 光谱解读,展示 LLM 在专业科学领域的新可能
- Gemma 4 12B: The Developer Guide — 无编码器多模态架构 + 音频输入 + 16GB 可跑,本地 AI 的新标杆
- Introducing the Google Colab CLI — 本地终端无缝连接远程 GPU/TPU,开发者和 AI Agent 的新执行平台
引用链接
- A harness for every task: dynamic workflows in Claude Code
- Running an AI-native engineering org
- Lessons from building Claude Code: How we use skills
- Best practices for getting started with Claude Cowork
- The Claude Cowork product guide
- How Anthropic enables self-service data analytics with Claude
- Making Claude a chemist
- Gemma 4 12B: The Developer Guide
- Bringing Gemma 4 12B to your Laptop
- Introducing the Google Colab CLI
- Ideogram 4.0 开源
- 扣子 3.0
- OpenAI Sites
- ChatGPT Memory (Dreaming V3)
夜雨聆风