乐于分享
好东西不私藏

AI产业前沿速递(0430)

AI产业前沿速递(0430)

人工智能技术的飞速进步,正在重塑全球商业格局,其影响辐射到各个行业领域。一目科技微信公众号定期推出《AI产业前沿速递》,从技术动态、行业应用、政策趋势等方面汇聚全球人工智能的最新动态。

技术动态
主题英伟达:开源机器人操控框架CaP-X
概况:4月2日,英伟达开源机器人操控框架CaP-X。
CaP-X框架包含交互式训练环境CaP-Gym、层级化基准测试CaP-Bench、无需训练的智能体框架CaP-Agent0和强化学习进化算法CaP-RL等四大组件,成功将代码自动存入可复用技能库。基于”代码即策略”理念和CaP-X框架,机器人通过摄像头看懂环境后由大模型编写Python代码实现自主控制。
技术原理:代码即策略、具身智能、视觉-语言-动作(VLA)、自动技能库、Python 代码生成
参考链接英伟达给机器人装上龙虾大脑!具身智能的Harness来了
主题谷歌DeepMind:发布Gemma 4系列模型
概况:近日,谷歌DeepMind发布Gemma 4,一口气放出四款开源模型。
Gemma 4包含E2B(20亿参数)、E4B(40亿参数)、26B混合专家模型和31B密集模型,专为本地运行优化。其E2B版本可在手机和树莓派等设备上完全离线运行,支持128K上下文和多模态输入,具备对话、翻译、OCR识别等功能。
技术原理:混合专家(MoE)、每层嵌入(PLE)、交替注意力、端侧优化、多模态
参考链接谷歌Gemma 4深夜突降,31B爆杀20倍巨头!手机跑全血「龙虾」
主题Meta:发布全新自研模型Muse Spark
概况:4月9日,Meta超级智能实验室(MSL)发布全新自研模型Muse Spark。
Muse Spark具备多模态感知、工具调用、视觉思维链和多智能体协同能力。该模型定位为个人超级智能基础,目前仅在Meta AI应用中使用,尚未开源。
技术原理:原生多模态、视觉思维链、多智能体协同、思维压缩、并行推理
参考链接突然袭击!刚刚,Meta超级智能团队首个大模型来了
主题World Labs:开源3D高斯溅射渲染引擎Spark 2.0
概况:4月15日,李飞飞的世界模型团队World Labs开源3D高斯溅射渲染引擎Spark 2.0,专为网页端设计,支持亿级粒子的超大3D场景流畅运行。
Spark 2.0基于Three.js和WebGL2开发,通过Level-of-Detail(LOD)技术动态调整渲染细节,渐进式流式加载技术实现从模糊到清晰的平滑呈现,并采用虚拟内存机制优化GPU资源使用。支持兼容手机、VR等设备,已应用于游戏、艺术创作等领域。
技术原理:3D高斯溅射、细节层次(LoD)、渐进式流式加载、GPU虚拟内存、网页端渲染
参考链接网页里直接跑1亿+高斯泼溅3D交互世界!李飞飞团队Spark 2.0 开源横空出世,“3D世界的通用基建”,人人能玩,任意设备适用
行业应用

主题:Anthropic:发布Claude Managed Agents

概况:4月9日,Anthropic发布Claude Managed Agents,一套可组合的API套件,专为在云端大规模构建和部署智能体而设计。

该架构由会话、控制器和沙箱三部分组成,将智能体开发从基础设施搭建简化为直接定义任务逻辑,支持长时间运行任务、多智能体协同,并提供企业级权限控制和执行追踪。其核心创新在于将AI从“生成内容”升级为“执行任务”的生产系统。

技术原理:云原生架构、托管式基础设施、多智能体协同、任务编排

应用方向:企业级自动化、生产级智能体、复杂工作流、执行追踪

参考链接:重磅!Anthropic又一个平台级产品炸场:Harness难题一次性解决,把Agent宠物变成牲口

主题:Google:发布Mac版Gemini原生应用

概况:4月15日,Google正式发布Mac版Gemini原生应用。

Apple Silicon原生适配,支持Option+Space快捷键呼起、屏幕共享上下文感知、Nano Banana图像生成、70语言Gemini 3.1 Flash TTS,以及ChatGPT/Claude聊天历史无缝迁移五大功能。

技术原理:原生应用、屏幕感知、系统级交互、全局快捷键

应用方向:桌面AI助理、办公效率、跨软件操作、多模态输入

参考链接:才发现,Google Gemini 出了 Mac 版,居然可以读我的屏幕了

主题:MiniMax:上线云端沙箱AI助手MaxHermes

概况:4月16日,MiniMax上线云端沙箱MaxHermes,基于Hermes Agent构建的云端自我进化AI助手。

MaxHermes每完成任务自动提炼可复用Skills,由Agent自主生成迭代,支持跨会话记忆、定时任务与多子代理并行。已打通飞书、钉钉、企业微信等多IM渠道,支持7×24小时实时响应。

技术原理:云端沙箱、自我进化、技能复用、跨会话记忆

应用方向:企业办公协同、自动化执行、7×24小时响应、多IM渠道接入

参考链接:MaxHermes:全球首个云端沙箱 Hermes,一键养“马”

主题:OpenAI:发布新一代旗舰模型GPT-5.5

概况:4月23日,OpenAI正式发布新一代旗舰模型GPT-5.5,官方将其定位为“面向真实工作的全新智能层级”。

GPT-5.5主打编程、计算机操作和科研能力提升。相比GPT-5.4,它在终端命令行、代码调试等任务上准确率提升7%-8%,使用相同token量时智能得分更高。该模型新增了400k上下文窗口的Codex编程支持,并通过自优化算法实现20%的推理加速。

技术原理:自优化算法、长上下文、端到端任务规划、推理加速

应用方向:自主编程、科研辅助、复杂指令执行、跨软件操作

参考链接:一文读懂GPT-5.5:从今天起,OpenAI“不卖”Token了
政策趋势

主题:教育部等五部门:印发《“人工智能+教育”行动计划》

概况:4月8日,教育部、国家发展改革委、工业和信息化部、科技部、国家数据局联合印发《“人工智能+教育”行动计划》,旨在一体推进人工智能人才培养和应用创新,统筹谋划基础环境和创新生态建设,系统构建智能时代的教育体系。

《行动计划》提出推进“十五五”期间“人工智能+教育”四大重点任务。一是推动人工智能人才培养与素养提升。二是促进人工智能与教育深度融合。三是建强“人工智能+教育”基础环境。四是打造“人工智能+教育”开放生态。

参考链接:速递!教育部等五部门联合印发《“人工智能+教育”行动计划》

主题:国家网信办等六部门:发布《人工智能拟人化互动服务管理暂行办法》

概况:4月10日,国家网信办、国家发展改革委、工业和信息化部、公安部、市场监管总局联合公布《人工智能拟人化互动服务管理暂行办法》,旨在促进人工智能拟人化互动服务健康发展和规范应用。

《办法》聚焦人工智能技术模拟人类情感交互的服务形式,要求提供者建立全生命周期安全管理制度,强调对未成年人和老年人的保护。同时,办法创新引入监管沙箱机制,允许在限定条件下测试新技术应用。

参考链接:人工智能拟人化互动服务管理暂行办法

主题:欧盟AI法案高风险条款拟延期实施

概况:欧盟人工智能法案虽已生效,但其执行节奏正经历实质性的再评估。

4月19日,德国总理默茨在汉诺威工业博览会上将现行AI监管框架描述为“过于狭窄的紧身衣”,直言监管“过于严格”,呼吁为工业领域AI应用提供更宽松环境。当前,欧盟决策者正在考虑延后部分“高风险AI系统”的合规义务,将实施时间推迟至2027年前后。

欧盟此前提出的AI责任单独立法路径也已被放弃,转向“前端合规+后端责任”的双支柱结构。

参考链接:欧盟AI监管路径生变

主题:国务院:明确支持采购大模型、智能体服务

概况:4月21日,国务院印发《关于推进服务业扩能提质的意见》,明确提出深入实施“人工智能+”行动,并首次在国家级文件中明确支持采购大模型、智能体服务,同时设定到2030年服务业总规模迈上100万亿元台阶的宏伟目标。

这标志着我国人工智能产业从“鼓励探索”正式迈入制度性采购、规模化落地的全新阶段,为服务业高质量发展注入强劲智能动能。

参考链接:国务院关于推进服务业扩能提质的意见

以上图片均来源于网络。

关于一目

一目科技致力于构建面向通用物理 AI 的世界模型与机器人技术体系。

通过以触觉为核心的物理交互学习,我们将多模态感知与世界模型深度融合,使机器能够理解接触与物理因果,从而构建更贴近现实的世界模型,实现从“感知世界”迈向“建模世界”的跃迁。

这一能力使机器人能够在真实环境中实现稳定操控与任务泛化。公司打造从感知、认知到行动的全栈闭环能力,推动 AI 从数字智能走向具身智能,加速物理 AI 的进化。

截至目前,一目科技已在全球范围布局超700件知识产权,先后获得国家高新技术企业认定与省专精特新中小企业认定,通过了 ISO质量/环境/职业健康安全管理三体系认证与 AAA级信用企业认证,四年内共荣获12项国际大奖。