Amaker AI周报 | 2026-23:物理AI成为AI下半场核心赛道

Amaker AI周报（2026.5.30-2026.6.5）

本周AI要闻

5月30日

• Anthropic官方CLI编程工具claude-code随Claude Opus 4.8发布同步更新，GitHub星标单日新增超2万
• AI Agent性能调优框架ECC开源，GitHub星标单日新增超3万
• 知名科技播客聚合频道Cognitalk更新31档全新节目，内容横跨AI突破、数学物理、创业融资

5月31日

• OpenAI正式公布模型弃用时间表：o3-mini模型将于2026年8月1日停止服务，o3和GPT-4.5 Turbo模型将于2026年9月1日全面下线
• GitHub Copilot从固定订阅转为按token用量计费正式生效

6月1日

• 英伟达在GTC Taipei发布Cosmos 3，全球首个全开源物理AI基础模型，统一打通视觉推理、世界生成、动作预测三大核心能力
• 英伟达发布NVIDIA Isaac GR00T人形机器人参考设计，首款基于NVIDIA Jetson Thor和Isaac GR00T开放开发平台构建的开放式参考设计
• 英伟达与联发科合作推出RTX Spark超级芯片，采用台积电3纳米制程，AI算力达1 Petaflop
• MiniMax发布新一代大模型M3，采用自研稀疏注意力架构MSA，SWE-Bench Pro编程评测拿到59.0%，超越GPT-5.5和Gemini 2.5 Pro
• 宇树科技73天闪电过会，锁定"A股人形机器人第一股"
• OpenAI发布芯片抽象层软件，剑指NVIDIA CUDA护城河

6月2日

• 微软Build 2026开发者大会开幕，一次性发布7款自研MAI系列模型，包括MAI-Thinking-1推理模型、MAI-Code-1-Flash编程模型等
• 微软发布常驻智能体Scout和Project Solara硬件
• 腾讯微信内嵌AI智能体原型测试消息密集曝光，以右滑入口形式融入微信，用户通过自然语言即可调用小程序完成打车、外卖等任务
• 黄仁勋在GTC Taipei演讲中表示，AI将从生成式AI向智能体AI演进，实用AI时代正式开启

6月3日

• 谷歌DeepMind发布Gemma 4 12B，120亿参数的无编码器多模态模型，可在16GB笔记本上运行，采用Apache 2.0许可
• 英伟达发布DGX Station桌面级AI超算，搭载748GB内存，可运行万亿参数模型
• 腾讯云DeepSeek-V4降价最高97.5% 正式生效
• DeepSeek完成首轮融资约70亿美元，腾讯、宁德时代、网易、京东参投
• 特朗普签署一项经过修改的AI行政命令，要求前沿AI模型在发布前进行自愿性的30天联邦审查，重点关注国家安全和网络安全风险

6月4日

• Anthropic在官方博客发布题为 《当AI构建自身》 的长文，呼吁全球顶尖AI实验室考虑放缓乃至暂停前沿AI的开发
• Anthropic秘密提交IPO申请，估值达9650亿美元，超越OpenAI的8520亿美元
• UC Berkeley发布研究报告，指出LLM使用与学生考试成绩下降存在相关性

6月5日

• 北大EvoPhys团队与摩尔线程联合发布EvoPhys-World 5D世界模型
• 斯坦福教授李飞飞发表论文 《From Words to Worlds》，为"世界模型"概念画出权威的"三分法"地图
• 英伟达在COMPUTEX 2026与GTC Taipei联动大会收官当日正式官宣NVIDIA Cosmos 3为"全球首款完全开放的全模态物理AI模型"，并牵头成立 "全球物理AI开发者协作联盟"
• 高通在2026高通汽车技术与合作峰会上联合多家生态企业正式推出车端人工智能Claw生态计划
• 腾讯云在2026腾讯云AI产业应用大会上首发 "效率智能体工具集"，针对不同人群、20多个垂直场景提供差异化智能体解决方案
• 新华网宣布投入11.22亿元打造AI时政资讯智能体"新华语典"，6月26日上线
• 全球首个全屋生成世界模型Kairos-HomeWorld发布，支持文本一键生成可交互3D家居场景
• 深圳河套学院AI训练平台项目团队联合哈工大深圳、深圳市大数据研究院、华为有关团队，依托昇腾910C国产AI算力集群，完成1.6万亿参数大模型DeepSeek-V4-Pro全参数后训练
• 中国信通院牵头立项的 《Service Framework for AI in Broadband》 和 《Service Requirements for AI Agents in Broadband Networks》 两项标准提案在宽带论坛2026年春季会员会议上正式立项

AI开源社区动态

• Google DeepMind发布Gemma 4 12B：无编码器多模态模型，将视觉令牌作为同一架构中的一等公民处理，提升了跨模态推理能力。可在16GB笔记本上运行，采用Apache 2.0许可，已在Hugging Face上线
• 英伟达发布Cosmos 3全开源物理AI基础模型：采用混合Transformer架构，原生支持文本、图像、视频、环境声音和动作五种模态。提供Super(最高精度)、Nano(亚秒推理)和Edge(边缘端)三种规格，在PAI-Bench、RoboArena等全部物理AI基准测试中排名第一。已通过HuggingFace、GitHub完全开源
• MiniMax发布M3大模型：国内首个同时集齐"百万上下文 + 原生多模态 + 桌面自动化"三项能力的开源模型，承诺10天内开源完整权重。处理百万上下文时每个Token计算量压到上一代的1/20，推理成本大幅压缩
• MiniMind-O开源：仅0.1B参数的Omni模型，用单一权重实现了文本、语音、图像的多模态输入，并能直接输出流式语音。可在单张NVIDIA RTX 3090上约2小时跑通完整训练链路，CPU上即可快速推理
• Ever OS开源：由EverMind团队开发的智能体长期记忆操作系统，整体架构受人脑信息处理方式的启发，分成基础设施层、业务层、记忆层和智能体层。采用的hyperm超图记忆架构已入选ACL 2026
• Anthropic官方CLI编程工具claude-code更新：深度理解代码库，支持通过自然语言命令完成代码编写、解释、重构及Git工作流管理。GitHub星标已达127,841
• AI Agent性能调优框架ECC开源：Anthropic黑客松冠军项目，覆盖Claude Code、Codex、Cursor等主流工具。核心五大支柱：技能、本能、记忆、安全和研究优先。GitHub星标已达198,538

AI工具推荐

1. 腾讯云"效率智能体工具集"

• 发布时间：2026年6月5日
• 核心功能：针对不同人群、20多个垂直场景提供差异化、个性化的智能体解决方案
• 个人用户端：升级QClaw、WorkBuddy、元宝、ima、腾讯文档等"开箱即用"AI工具，让效率触手可及
• 企业客户端：全新发布WorkBuddy企业版AI工作台，同步升级ClawPro、腾讯云智能体开发平台(ADP)、企点营销云等核心产品，打造覆盖全生命周期的服务体系
• 特点：深度融合腾讯生态，支持智能体与微信、企业微信等平台无缝对接，实现真正的任务闭环

2. Kairos-HomeWorld

• 发布时间：2026年6月5日
• 核心功能：全球首个全屋生成世界模型，支持文本一键生成可交互3D家居场景
• 技术特点：基于先进的世界模型技术，能够理解复杂的家居空间布局和物体关系
• 使用体验：用户只需输入自然语言描述，即可生成完整的3D家居环境，包括家具摆放、材质纹理、光照效果等，并且可以实时交互和修改
• 应用场景：室内设计、家居电商、房地产展示、元宇宙等领域

AI播客概览

• ai0.news：每日更新的AI新闻简报，本周重点报道了Anthropic IPO、Gemma 4发布、微软Build大会、特朗普AI行政命令等重要事件。每集时长约10分钟，信息密度高，适合快速了解全球AI动态
• AI圈儿：中文AI每日资讯播客，本周详细解读了英伟达GTC Taipei大会、腾讯云AI产业应用大会等国内重要AI活动。提供播客全内容文档和AI技术干货分享
• AI观测站：聚焦AI圈与科技行业的最新新闻、产品动态和趋势变化。本周分析了物理AI赛道的竞争格局和智能体时代的商业机会，深入探讨了这些事件背后的竞争逻辑和商业价值
• OpenAI Builders - Unscripted：本周发布第3期，采访了Alchemy产品负责人Matias Castello，探讨了AI在区块链领域的应用和未来发展方向

Amaker AI 观察

1. 趋势研判

物理AI成为AI下半场核心赛道

• 事实论据：本周英伟达发布Cosmos 3全开源物理AI模型并成立全球协作联盟；北大发布EvoPhys-World 5D世界模型；李飞飞发表论文为世界模型概念建立权威框架
• 趋势分析：AI正在从数字世界向物理世界延伸，物理AI将成为连接虚拟与现实的关键技术。未来十年，人形机器人、自动驾驶、智能制造、AI工厂等领域将迎来爆发式增长，创造数十万亿美元的市场价值

智能体(Agent)进入大规模落地阶段

• 事实论据：微软发布常驻智能体Scout；腾讯云首发"效率智能体工具集"；阿里千问全面开放第三方Agent入驻；微信内嵌AI智能体进入原型测试
• 趋势分析：智能体已经从概念走向实用，成为各大科技公司竞争的焦点。未来，智能体将渗透到工作和生活的各个方面，从个人助理到企业服务，从软件开发到工业生产，智能体将成为人类的"数字同事"，大幅提升生产力

端侧AI能力大幅提升

• 事实论据：谷歌Gemma 4 12B可在16GB笔记本上运行；英伟达RTX Spark超级芯片提供1 Petaflop AI算力；MiniMind-O仅0.1B参数即可实现全模态输入输出
• 趋势分析：强大的AI能力正在从云端向端侧转移，这将带来更低的延迟、更高的隐私性和更广泛的应用场景。未来，每一台设备都将具备强大的AI能力，成为个人智能体的运行平台

AI自主研发能力快速提升

• 事实论据：Anthropic报告显示，其代码库中已有超过80%由Claude编写，工程师日均交付代码量达到2024年的8倍；腾讯汤道生表示今年腾讯大部分代码都是由AI生成
• 趋势分析：AI已经开始加速自身的研发进程，递归自我优化可能比预期更早到来。这将带来技术进步的指数级加速，但也带来了前所未有的安全挑战，需要全球共同应对

2. AI人物

• 黄仁勋（英伟达创始人兼CEO）："AI将从生成式AI向全新形态演进。如今，下一波浪潮——智能体AI（Agentic AI）已经来了，实用AI时代正式开启。AI不是在聊天，是在干活。"（GTC Taipei 2026主题演讲）
• 黄仁勋（英伟达创始人兼CEO）："计算就是收入、瓦特就是收入、每一个token都是收入！"（GTC Taipei 2026主题演讲）
• 汤道生（腾讯集团高级执行副总裁、云与智慧产业事业群CEO）："今年腾讯大部分代码都是由AI生成，腾讯的工程师可能会花更多的时间去做架构设计等，他们把写代码的工作都交给AI了，定期指导、修正AI写的东西。"（2026腾讯云AI产业应用大会）
• 李飞飞（斯坦福大学教授）："空间智能是AI的下一个前沿。当前的大语言模型虽擅长处理抽象知识，却缺乏对物理世界的真实理解，如同在'黑暗中行走'。空间智能（即在3D空间和时间中感知、推理和行动的能力）是实现AGI（通用人工智能）的关键突破，没有空间智能，通用人工智能就不完整。"（论文《From Words to Worlds》）

3. 争议与思考

Anthropic呼吁暂停前沿AI研发引发广泛争议

• 支持方观点：Anthropic报告显示AI已经开始加速自身研发，递归自我优化可能带来不可控风险；需要让社会制度和对齐研究跟上技术步伐，避免技术发展失控
• 反对方观点：部分官员和学者认为Anthropic夸大了风险，暂停研发会让其他国家在AI领域取得领先；自愿性的暂停难以执行，反而会导致监管套利
• 理性研判：AI安全问题确实需要高度重视，但全面暂停研发并不现实。更合理的做法是建立健全的监管框架，加强国际合作，推动AI安全对齐研究，确保AI技术的发展符合人类的整体利益。同时，应该鼓励透明化的研发和负责任的创新，让AI技术更好地造福人类

UC Berkeley关于LLM使用与学生考试成绩下降的研究引发教育界讨论

• 支持方观点：过度依赖LLM会导致学生独立思考和学习能力下降；学校应该加强对学生使用AI工具的引导和管理，避免学生养成投机取巧的习惯
• 反对方观点：AI是未来的必备工具，禁止学生使用会让他们落后于时代；应该将AI融入教学过程，培养学生的AI素养，让他们学会如何与AI协作
• 理性研判：AI工具的普及是不可逆转的趋势，教育体系需要适应这一变化。学校应该制定明确的AI使用规范，引导学生正确使用AI工具作为学习辅助，同时注重培养学生的批判性思维和创新能力。教育的目标应该从传授知识转向培养能力，让学生在AI时代具备核心竞争力。