摘要
2026 年 6 月 5 日 AI 资讯合集,呈现出一个极其鲜明的产业信号:
AI竞争的焦点正在从“大模型能力竞争”,转向“Agent(智能体)+ 世界模型 + 具身智能 + AI自我进化”的新阶段。
如果说 2023 年是“大模型元年”,2024-2025 年是“Agent元年”,那么从文档内容来看,2026 年已经开始进入:
“AI构建AI、世界模型驱动机器人、Agent接管业务流程”的产业化深水区。
文档中高频出现的主题包括:
具身智能(Embodied AI) 世界模型(World Model) Agent系统 AI自我进化(Recursive Self-Improvement) 企业智能体 长上下文推理 AI安全治理 AI记忆系统 多智能体协作 Coding Agent 机器人训练数据基础设施
其中最值得关注的是:
Anthropic关于“AI递归自我改进”的警告、腾讯AI下半场战略、北大EvoPhys-World、Kairos-Homeworld机器人住宅训练体系、Nemotron 3 Ultra长程Agent模型。
总结与洞察
核心主线是什么?
整个文档实际上围绕一条主线展开:
从“语言模型”走向“行动模型”
过去:
AI负责回答问题
现在:
AI开始执行任务
未来:
AI开始构建下一代AI
Anthropic已经明确提出:
Claude不仅能写代码,还开始参与代码审查、实验设计和系统优化,未来可能形成递归自我改进闭环。文档中多次出现“AI造AI”“自我进化”“递归改进”等关键词。
这意味着:
“工具时代正在结束,智能体时代正在开始。”
世界模型正在成为机器人时代的基础设施
文档中出现频率最高的技术方向之一就是:
Kairos-Homeworld EvoPhys-World τ0-WM TransWorld NeoVerse-ABot
这些项目有一个共同目标:
让机器人拥有“理解世界、预测世界、操控世界”的能力。
尤其是:
Kairos-Homeworld直接提供:
30万中国住宅户型 5000完整家庭场景 4B世界模型
形成机器人版“互联网预训练语料库”。
Agent开始成为企业软件的新操作系统
腾讯、Anthropic、OpenAI、NVIDIA、Claude Code几乎都在押注同一件事:
Agent。
企业软件正在经历:
ERP → SaaS → Copilot → Agent OS
腾讯提出:
WorkBuddy Agent Suite ADP 4.0 ClawPro
形成完整企业智能体生命周期体系。
这意味着:
未来企业采购的可能不再是软件。
而是:
“数字员工”。
技术核心价值与商业化落地的关键摩擦点在哪里?
价值一:数据飞轮开始出现
文档最有价值的案例之一:
蔚蓝科技 BabyAlpha A3。
累计:
销量2.5万+ 交互6548万次 使用时长9.5亿分钟
相比人形机器人:
四足机器人先进入家庭。
先获得数据。
先形成飞轮。
这验证了:
“不是技术最先进的产品赢,而是最早获得真实反馈的产品赢。”
价值二:Agent正在成为新的生产力单位
腾讯与Anthropic都在强调:
未来不是单个模型竞争。
而是:
Context Workflow Tool Use Agent Runtime
竞争。
真正价值已经从:
“大脑”
转向:
“手脚”。
最大摩擦点:安全与失控风险
Anthropic是全文最强烈的风险信号。
其担忧:
AI写代码 AI优化AI AI设计实验 AI构建下一代AI
形成递归增长。
这也是文档反复出现:
HarnessAudit AI Alignment AI Governance 安全评测框架
的原因。
一句话概括:
“能力增长速度已经开始超过治理体系建设速度。”
对决策者/产品经理/CTO/算法工程师/医学经理的直接行动建议
对决策者
重点关注:
Agent替代流程 AI组织重构 数字员工体系
未来3年最重要的问题不是买模型。
而是:
企业哪些岗位能够Agent化。
对产品经理
重点研究:
Context Engineering Agent UX 多智能体协同
未来产品设计核心:
不是按钮。
而是任务流。
对CTO
重点布局:
Agent Runtime 世界模型 长上下文 Tool Calling
企业AI基础设施将从:
Model First
转向:
Agent First。
对算法工程师
未来三大黄金赛道:
Agent World Model Embodied AI
文档出现频率最高。
对医学经理
重点关注:
Agent医疗助手 医疗世界模型 医学知识长期记忆 医疗多智能体协作
虽然本期医疗内容不多,但从Agent、世界模型、长期记忆的发展方向看:
未来医疗AI将从问答工具升级为:
“诊疗流程执行系统”。
国内技术关键词
Kairos-Homeworld(大晓机器人+港中文MMLab)[★★★★★]
全球首个全屋三维生成与物体级交互统一框架,提供30万住宅户型与5000家庭场景,构建机器人训练基础设施。
Kairos 3.0-4B(大晓机器人)[★★★★★]
4B参数世界模型,提升机器人环境理解与任务执行能力。
EvoPhys-World(北京大学)[★★★★★]
全球首个自进化5D世界模型,引入时间维与控制维,实现预测、决策与物理交互闭环。
WorkBuddy(腾讯)[★★★★★]
企业级效率智能体平台,实现知识查询、流程执行与办公协作自动化。
ADP 4.0(腾讯云)[★★★★]
企业Agent开发平台,支持构建、评测、发布生产级智能体。
ClawPro(腾讯)[★★★★]
企业Agent治理平台,覆盖权限、安全与审计。
Qwen-VLA(阿里通义)[★★★★★]
VLA策略模型+扩散动作生成+强化学习路线,推动机器人跨场景泛化。
τ0-WM(智元机器人)[★★★★★]
5B参数开源具身世界模型,使用1.78万小时真机数据预训练。
NeoVerse-ABot(中科院自动化所)[★★★★]
世界模型竞赛冠军方案,融合视觉与动作预测。
TransWorld(智行者)[★★★★]
基于1.6亿公里驾驶数据构建物理AI飞轮。
Step 3.7 Flash(阶跃星辰)[★★★★]
11B激活参数MoE模型,400 token/s推理速度。
BabyAlpha A3(蔚蓝科技)[★★★★]
消费级四足机器人,率先形成家庭场景数据飞轮。
AFUN(机器人模型)[★★★★]
11项数据集SOTA,实现语言理解到三维动作规划。
MetaFine(东南大学+北京大学)[★★★★]
机器人精细操作评测框架。
OntoZ(百型智能)[★★★★]
企业级AI基础设施,支持群体智能体协作。
混元Hy3 Preview(腾讯)[★★★★★]
强调实用性与产品协同的大模型体系。
Agent Suite(腾讯)[★★★★]
办公场景可复用智能体套件。
NBA Chat(阿里巴巴+NBA中国)[★★★]
体育垂直大模型应用。
InfCode(词元无限)[★★★]
企业级Agent产品。
Spirit v1.6(千寻智能)[★★★]
具身智能核心模型。
国外技术关键词
Claude递归自我改进(Anthropic)[★★★★★]
AI自主写代码并参与下一代系统构建,引发安全讨论。
Dreaming Memory(OpenAI)[★★★★★]
时间感知记忆系统,算力下降5倍并支持动态更新。
Nemotron 3 Ultra(NVIDIA)[★★★★★]
550B参数长程Agent模型,支持100万Token上下文。
NotebookLM Source Attribution(Google)[★★★★]
回答可溯源引用机制。
Magenta RealTime 2(Google DeepMind)[★★★★]
实时音乐生成模型,提速15倍。
Gemma 4 12B Unified(Google DeepMind)[★★★★]
256K上下文原生多模态模型。
Ideogram 4.0(Ideogram)[★★★★]
93亿参数文字生成图像模型。
Grok Imagine Video 1.5(xAI)[★★★★]
图片生成视频模型。
Claude Code Dynamic Workflow(Anthropic)[★★★★]
动态工作流与多Agent协作框架。
HarnessAudit(UCSB)[★★★★]
AI Agent安全评测框架。
Fast-SAM3D(ETH Zurich+中科院)[★★★★]
单图3D重建速度提升2.67倍。
Krea 2 Turbo(Krea AI)[★★★]
2秒级高速生图模型。
Flows Agent(ElevenCreative)[★★★]
对话式构建复杂工作流。
Miso One(MisoLabsAI)[★★★]
110ms延迟情感TTS模型。
ArtiFixer(NVIDIA)[★★★]
3D重建增强模型。
OmniVTG(国际研究团队)[★★★]
开放世界视频时序定位数据集。
Token-Economics(研究社区)[★★★]
LLM Agent Token经济学框架。
Mellum2(JetBrains)[★★★]
12B代码智能体模型。
GPIC(斯坦福)[★★★]
1亿图文对视觉生成数据集。
Search as Code(Perplexity)[★★★]
搜索即代码的新型Agent检索范式。
医疗垂直关键词
本期文档医疗内容有限,但以下方向具有明显医疗价值:
具身智能医疗护理机器人(英伟达+宇树)[★★★★★]
面向护理与医疗辅助场景的人形机器人参考设计。
EvoPhys-World(北京大学)[★★★★★]
可扩展至手术模拟、康复训练、医疗数字孪生。
Dreaming Memory(OpenAI)[★★★★]
长期患者管理与连续医疗记忆的重要基础能力。
Agent Suite(腾讯)[★★★★]
适用于医疗办公自动化与知识管理。
AFUN机器人模型(★★★★)
具备语言理解与物理操作能力,可迁移至护理机器人。
其他垂直关键词
递归自我改进(Anthropic)[★★★★★]
AI开始参与AI研发,是未来ASI路径核心议题。
企业智能体生态(腾讯)[★★★★★]
Agent进入规模化企业落地阶段。
机器人住宅训练场(Kairos)[★★★★★]
真实世界数据基础设施创新。
四足机器人数据飞轮(蔚蓝科技)[★★★★★]
率先验证消费级具身智能商业模式。
世界模型(World Model)[★★★★★]
本期文档出现频率最高、最具趋势性的技术主线之一。
《周易》有言:“穷则变,变则通,通则久。” 从本期文档所呈现的技术演进来看,AI产业正在经历从“语言理解”到“世界理解”、从“知识生成”到“行动执行”、从“辅助人类”到“参与创造AI自身”的历史性跃迁。真正值得关注的,不再是模型参数增长了多少,而是谁先构建起“数据—Agent—世界模型—真实反馈”的闭环飞轮。这或许正是 2026 年 AI 产业最深层的主线。
夜雨聆风