1. OpenAI正式成立机器人事业部:DALL-E/Sora之父挂帅,AI龙头全栈杀入具身智能
6月1日,OpenAI CEO Sam Altman在社交平台发布招聘信息,正式宣布组建"OpenAI Robotics"团队,招募全栈硬件工程师、系统工程师及机器学习专家。联合创始人Greg Brockman同步发文,称目标是"打造能在物理世界帮助人类的AI"。OpenAI机器人战略分短期和长期两步走:短期聚焦协助型机器人,长期愿景是实现"人人拥有个人机器人"。Aditya Ramesh(DALL-E/Sora之父)已出任机器人事业部VP,全面负责硬件本体研发与具身AI大脑的软硬协同。
值得关注:OpenAI时隔六年重返机器人赛道,不是做"AI赋能",而是自研硬件本体。这意味着AI编程(软件)与具身智能(硬件)的两大龙头正在合流——OpenAI带着GPT级多模态模型进入物理世界,将从根本上改变具身智能"大脑"层的竞争格局。Aditya Ramesh从图像/视频生成跨界机器人,暗示OpenAI的具身战略将围绕"世界模型"而非传统机器人控制展开,这是一条与特斯拉/NVIDIA都不同的路线。
2. MiniMax M3发布:12小时自主复现顶会论文,国产模型首达Agentic Coding前沿
6月1日,MiniMax正式发布旗舰大模型M3,在SWE-Bench Pro上得分59.0%,超越GPT-5.5和Gemini 3.1 Pro,逼近Claude Opus 4.7;Terminal-Bench达66.0%,OSWorld计算机操作达70.06%。最震撼的是实战演示:M3在无人干预下自主运行近12小时,完整复现ICLR 2025杰出论文的全部实验流程,产出18次commit、23张图表。M3支持100万token上下文、原生多模态(文本+图像+视频输入),并以开源权重发布。
值得关注:M3的意义不在于跑分,而在于它证明了"你告诉它目标,它自己找到路"的Agent范式——从读论文到写代码到跑实验到出图,全链路自主。这是国产模型首次在Agentic Coding综合能力上进入全球第一梯队。结合1M上下文+开源权重,M3将加速AI编程Agent在中国开发者中的渗透,并可能影响DeepSeek V4的定价与开源策略。
3. AGIBOT智元亮相IDC大会:人形机器人与IDC CEO实时对话,宣告"部署元年"
6月5日北京IDC Directions大会上,AGIBOT(智元机器人)全尺寸人形机器人A2和A3在开幕式上与IDC CEO Lorenzo进行了实时舞台对话。AGIBOT合伙人王闯发表题为"迎接具身AI生产力新纪元"的主旨演讲,宣布2026年标志着行业从开发探索阶段正式进入"部署时代",公布了7大生产力应用场景:工业装卸、物料搬运、物流分拣、导购辅助、零售服务站、安检巡查和商业清洁。IDC数据显示全球人形机器人市场前一年增长800%,AGIBOT在2025年出货量上超越所有竞争对手。
值得关注:智元用"部署元年"替代了行业此前常用的"量产元年"——一个字的差异指向完全不同的阶段。量产解决"能不能做出来",部署解决"做了有没有人用、能不能挣钱"。7大场景覆盖从工厂到商场到机场的完整版图,智元正在定义中国具身智能的商业化路径。IDC CEO那句"2026年你是否能在不了解中国的情况下做出任何重大技术决策"——既是对中国具身智能产业的背书,也是对整个科技行业的提醒。
4. Memory OS开源:AI编程Agent装上6层"长期大脑"
6月1日,基于开源Agent框架Hermes Agent构建的Memory OS正式开放源代码(MIT协议)。它设计了6层记忆架构:工作区文件(MEMORY.md/USER.md)→ 会话历史(SQLite+FTS5全文搜索)→ 结构化事实(信任评分+反馈闭环)→ Fabric跨会话提取(16个工具)→ Qdrant向量数据库(4096维语义+BM25混合检索)→ LLM Wiki自动策展。检索在每次LLM调用前从四个数据源同时拉取,经相关性阈值门控后注入上下文。
值得关注:Memory OS解决的是AI编程Agent最根本的短板——"金鱼记忆"。一个Agent能记住项目过去三个月的所有讨论、架构决策和踩坑记录,不再需要人类每次重新解释一切。它的设计哲学"记忆不是功能而是操作系统"值得深入思考:如果AI编程工具的下一个战场不是更好的代码生成,而是更好的上下文管理,那评估标准也将从"SWE-Bench得分"转向"长期协作效率"。这可能是2026年AI编程赛道最重要却最被低估的趋势。
5. 优必选优世界:全球首款全尺寸超仿生人形机器人京东预售,具身智能破圈C端
6月2日,优必选旗下消费级人形机器人品牌"优世界(UWORLD)"正式发布,全球首款全尺寸超仿生人形机器人在京东开启预售,6月30日正式面世。产品提供男女两款:男款身高183cm、体重42kg,女款身高168cm、体重35.2kg,均搭载88个自由度。定位"家庭全场景情感陪伴",主打独居陪伴与老人关怀场景。此前优必选在香港科学馆、迪拜未来博物馆等场所已有部署经验。
值得关注:这是具身智能从B端工业场景向C端消费场景的关键破圈。88自由度意味着这不是玩具,而是真正的人形交互入口。虽然短期内消费级人形机器人的市场规模远小于工业场景,但C端曝光将加速公众对"家庭机器人"的认知接受——特斯拉Optimus和宇树GD01也在向消费端渗透。具身智能正在重走智能手机的路径:先在工业场景验证,再向消费市场扩散。
6. Nemotron 3 Ultra登陆AWS + OpenAI Realtime API正式商用:AI基础设施双线推进
6月4-5日,两条AI基础设施消息值得关注。NVIDIA Nemotron 3 Ultra(550B参数混合Transformer-Mamba MoE架构)登陆AWS SageMaker JumpStart,采用NVFP4精度优化实现5倍吞吐量提升、成本降低30%,专为长运行Agent工作负载设计。同一天,OpenAI宣布Realtime Audio API正式结束Beta,三款模型(GPT-Realtime-2、Realtime-Translate、Realtime-Whisper)可用于生产环境,旗舰模型定价每百万音频token输入$40/输出$80。
值得关注:两条看似独立的消息指向同一个趋势——AI基础设施从"训练优化"转向"推理优化"。Nemotron专为Agent长运行设计(1M上下文跨数百轮),Realtime API面向实时交互场景,都在解决"AI在生产环境中稳定运行"的问题而非"模型能不能更强"。AI编程Agent和大规模机器人部署的底层算力需求正在催生全新的基础设施层。
7. "Great American AI Act"草案公布:269页联邦AI立法,联邦优先权条款引争议
6月4日,美国众议员Jay Obernolte与Lori Trahan联合四位共同发起人提出269页跨党派AI立法讨论稿。四大支柱:前沿模型安全(将CAISI编入法典)、劳动力影响追踪、网络安全、AI研发。核心争议条款——三年内联邦优先权覆盖所有州级AI法律,这意味着科罗拉多州AI法案(6月30日生效)仅剩25天窗口,加州不断增长的AI法律组合也将被暂停。200多名州议员已联名反对,此前该条款在多个法案中均被参议院高票删除。
值得关注:联邦vs州权的AI监管博弈将直接影响AI编程与具身智能在全球最大市场的游戏规则。如果联邦统一监管落地,对OpenAI/Anthropic等巨头是利好(一套规则替代50套),但对小型AI初创公司意味着更高的合规成本。对中国AI企业而言,美国联邦AI立法的信号值得密切关注——它可能定义AI技术出口管制、跨境数据流动和具身智能硬件贸易的新边界。
数据来源:腾讯新闻、新浪财经、IDC Directions官方、aireporter.news、eastdigi.com、aitoolsrecap等
夜雨聆风