
技术动态
01
高德:发布ABot全栈技术架构
4月19日,高德发布ABot全栈技术架构,包含数据层、模型层和agent层的闭环系统。
ABot全栈技术架构由世界模型ABot-World、导航模型ABot-N和操作模型ABot-M组成,采用双引擎架构实现物理硬约束训练,其核心突破在于通过可交互数字孪生空间生成真实训练场景,并支持机器人自主感知与决策。
高德具身产品官网:
https://abot.amap.com
高德视觉技术中心:
https://github.com/amap-cvlab

原文链接>> 高德公布ABot技术全栈|当空间智能从像素走向物理世界
02
Physical Intelligence:发布VLA模型π0.7
4月17日,Physical Intelligence发布VLA模型π0.7,在机器人领域证明组合泛化能力,可将学过的原子技能组合解决新任务。
π0.7基于多模态提示框架,整合语言指令、动作元数据和视觉目标图像,通过50亿参数VLA架构实现跨机器人本体迁移。核心方法是将prompt展开为任务指令、子任务指令、子目标图像、元数据四层,让模型吃下多样化数据。
论文链接:
https://www.pi.website/download/pi07.pdf

原文链接>> π0.7发布,VLA押出了机器人的GPT-3时刻
03
腾讯:发布并开源混元3D世界模型 2.0
4月16日,腾讯发布并开源混元3D世界模型 2.0(HY-World 2.0)。
HY-World2.0采用HY-Pano-2.0、空间Agent、HY-WorldStereo等新架构,支持真实场景数字孪生重建与角色交互探索。能够根据文字、图片、视频等不同类型输入,自动生成、重建和模拟 3D 世界,同时支持多格式3D资产(Mesh/3DGS/点云等)导出,支持与现有的游戏工作流无缝对接,用于快速生成游戏地图和关卡原型。
开源代码:
https://github.com/Tencent-Hunyuan/HY-World-2.0
技术报告:
https://3d-models.hunyuan.tencent.com/world/world2_0/HY_World_2_0.pdf

原文链接>> 腾讯混元3D世界模型2.0发布:无缝对接游戏工作流
04
蚂蚁:开源流式三维重建模型 LingBot-Map
4月16日,蚂蚁开源流式三维重建模型LingBot-Map,仅用普通RGB摄像头即可实时完成相机位姿估计与3D重建。
LingBot-Map采用纯自回归建模与几何上下文注意力机制(GCA),Oxford Spires数据集ATE误差仅6.42米,精度提升2.8倍;推理速度达20FPS,支持10000+帧长视频连续推理,赋能机器人导航。
HuggingFace:
https://huggingface.co/robbyant/lingbot-map
GitHub:
https://github.com/Robbyant/lingbot-map
Paper:
https://arxiv.org/abs/2604.14141

05
NVIDIA:推出开源量子AI模型系列NVIDIA Ising
4月16日,NVIDIA推出开源量子AI模型系列NVIDIA Ising,旨在帮助研究人员和企业构建能够运行实际应用的量子处理器。
包括:350亿参数的视觉语言模型(VLM)Ising Calibration(校准),能够快速解读并对来自量子处理器的测量结果做出反应;用3D CNN做实时纠错的Ising Decoding(解码),有分别针对速度和精度优化的两个版本。相比于当前开源行业标准pyMatching,Ising Decoding在速度上最多快2.5倍,精度高出3倍。
开源地址:
https://huggingface.co/collections/nvidia/nvidia-ising

06
World Labs:开源3D高斯溅射渲染引擎Spark 2.0
4月15日,李飞飞的世界模型团队World Labs开源3D高斯溅射渲染引擎Spark 2.0,专为网页端设计,支持亿级粒子的超大3D场景流畅运行。
Spark 2.0基于Three.js和WebGL2开发,通过Level-of-Detail(LOD)技术动态调整渲染细节,渐进式流式加载技术实现从模糊到清晰的平滑呈现,并采用虚拟内存机制优化GPU资源使用。支持兼容手机、VR等设备,已应用于游戏、艺术创作等领域。
博客地址:
https://www.worldlabs.ai/blog/spark-2.0

行业动态
01
Anthropic:推出Claude Design
4月17日,Anthropic推出新产品Claude Design,让用户通过使用Claude创建设计、可交互原型、PPT幻灯片、单页文档等视觉作品。
Claude Design基于Opus 4.7模型,支持通过对话生成可交互原型、PPT、单页文档等视觉作品;提供Tweaks、Comment、Edit、Draw等精细修改方式,可导出至Canva、PPTX、HTML或交给Claude Code生成代码。

原文链接>> Claude推出“Figma杀手”,设计软件股暴跌
02
智谱:AutoClaw上线自进化机制与Skill商店
4月17日,智谱AutoClaw(澳龙)正式上线自进化机制与Skill商店。
AutoClaw每轮对话后自动扫描值得记住的经验,经用户审批后写入记忆成为新能力;提供关键词触发与自动检测两种进化方式,保持每周1-3次的高质量进化而非噪音堆积。同步上线Skill商店与GLM Office Skills五件套,覆盖PPT、DOCX、XLSX、PDF、Charts全场景办公。

原文链接>> 不用研究Hermes!AutoClaw开启自进化
03
Google:发布Mac版Gemini原生应用
4月15日,Google正式发布Mac版Gemini原生应用。
Apple Silicon原生适配,支持Option+Space快捷键呼起、屏幕共享上下文感知、Nano Banana图像生成、70语言Gemini 3.1 Flash TTS,以及ChatGPT/Claude聊天历史无缝迁移五大功能。

04-1
阿里:发布开放式世界模型HappyOyster
4月16日,阿里发布开放式世界模型HappyOyster(快乐生蚝)。
HappyOyster基于原生多模态架构,支持多模态理解、音视频联合生成以及实时世界构建与交互。提供漫游(Wander)和导演(Direct)双模式,用户可通过文本、语音或图像指令实时生成、探索和修改动态场景。

04-2
阿里:发布AI开发工具Meoo(秒悟)
4月15日,阿里正式发布AI开发工具Meoo(秒悟)。
Meoo集成了千问、Kimi、GLM、MiniMax四大顶尖模型,并内置阿里云数据库、存储等核心产品服务,用户无需任何编程基础,只需用自然语言描述想法,Meoo最快1分钟就能自动生成前端后端完整的网站、H5页面,并在阿里云上一键部署上线。

原文链接>> AI开发工具秒悟Meoo来了,0门槛、一键部署上线!
05
阶跃星辰:发布语音生成模型 StepAudio 2.5 TTS
4月16日,阶跃星辰发布语音生成模型 StepAudio 2.5 TTS,支持全局语境控制、文中语境控制、零样本复刻与全音色控制三项核心能力。
StepAudio 2.5 TTS用自然语言描述即可精细控制情绪、语气、节奏、停顿与场景氛围,同一音色可呈现多层次表达风格;支持Zeroshot TTS与全音色控制,适配角色配音等多场景。

06
MiniMax:上线云端沙箱AI助手MaxHermes
4月16日,MiniMax上线云端沙箱MaxHermes,基于Hermes Agent构建的云端自我进化AI助手。
MaxHermes每完成任务自动提炼可复用Skills,由Agent自主生成迭代,支持跨会话记忆、定时任务与多子代理并行。已打通飞书、钉钉、企业微信等多IM渠道,支持7×24小时实时响应。

政策趋势
01
四川:印发《四川省支持人工智能OPC创新发展行动方案(2026—2027年)》
4月16日,四川省印发《四川省支持人工智能OPC创新发展行动方案(2026—2027年)》,旨在通过支持一人公司(OPC)模式推动人工智能创新创业。
《行动方案》提出建设30个以上生态社区、培育超1000家OPC企业、打造150个应用标杆的目标,并从链式培育、场景赋能、算力支撑、人才引育等方面提出具体措施。成都作为核心城市,将先行布局20个OPC社区,并配套最高2500万元的资金支持,涵盖安居、研发、融资等全链条服务。

02
南京:出台《2026年南京市加快推进“人工智能+软件”发展行动方案》
4月15日,南京出台《2026年南京市加快推进“人工智能+软件”发展行动方案》,明确总体要求和发展目标,重点实施“五大行动”,加快打造全国软件产业智能化第一城。
《行动方案》明确,聚焦软件企业向人工智能服务商、智能体开发商转型,以智能化重塑软件开发全流程为突破口,以培育智能体新业态为主线,实施智能化开发能力提升等五大行动,驱动全行业生产方式变革、产品形态重塑、商业模式创新、发展能级跃升,打造全国软件产业智能化第一城。2026年,全市软件产业智能化转型发展取得扎实成效。

声明:资料素材均来源官方媒体/网络,如有侵权,请联系删除。
✦
✦
END
南京新一代人工智能研究院
Nanjing Research
Institute of Next-generation Artificial Intelligence

南京新一代人工智能研究院,是中国信息通信研究院在人工智能、大数据领域投资组建的控股企业,是江苏省人工智能产业公共技术服务平台的落地运营单位。
研究院以“服务国家战略实施,促进地方产业升级”为导向,在人工智能和大数据领域,开展前沿技术研究、标准制定、评测工具开发、实验能力建设等工作,可为企业提供全方位的诊断、咨询、培训、评估服务。

联系方式
吴老师 17788386765(微信同号)
杨老师 15221125491(微信同号)
夜雨聆风