
编者按
今日焦点投向大模型架构突破与世界模型新赛道。MiniMax 发布首创 MSA 架构的 M3 开源旗舰,阿里云百炼 CLI 化降低 Agent 工程门槛;VAST 获近 2 亿美元融资并发布可解耦推演的世界模型 Project Eden。国际侧英伟达开源全模态物理 AI 大模型 Cosmos 3,具身仿真周期大幅压缩;Claude 天价账单事件引发 Token 经济反思,全球全模态 API 首现无限期免费开放。国产开源生态进阶与世界模型角力,正同步拉开帷幕。
浪 潮 专 项

浪潮信息AIStation支撑精密制造企业智能体应用扩展
近日,浪潮信息AIStation为企业多Agent规模化落地提供了统一运行与治理底座,成功将精密制造企业的算力利用率从不足30%提升至70%以上。平台通过弹性混部调度机制,对GPU、CPU等资源进行池化管理,依据业务优先级实现“在线实时任务优先、离线任务错峰复用”,有效应对全球化企业的多区域并发洪峰。同时,创新引入Token级成本治理,通过统一网关对Agent、部门及任务类型进行精细化消耗统计与分摊,并设置配额限流策略,彻底破解了Agent规模化应用的成本黑箱,让企业实现“管得住、用得好、成本可控”。

国 内 动 态

MiniMax 发布 M3 旗舰大模型 首创 MSA 架构 1M 上下文全面开源
MiniMax 正式发布新一代旗舰大模型 MiniMax M3,首创自研 MiniMax Sparse Attention(MSA)稀疏注意力架构,将上下文窗口提升至 100 万 Token,1M 规模下单 Token 计算量仅为上一代的 1/20。M3 是全球首个同时具备前沿编程能力、1M 超长上下文、原生多模态的开源大模型,SWE-Bench Pro 编程评测得分超越 GPT-5.5,智能体评测表现领先。模型权重与配套工具将全面开放,对标海外旗舰模型,为国产大模型开源生态提供新的核心选项。
阿里云百炼全面 CLI 化并开源 一行命令打通 AI Agent 全栈能力编排
阿里云正式宣布百炼平台全面 CLI(命令行界面)化,同步向全球开发者开源 CLI 项目。该工具将 150 余款主流模型、应用工作流、知识库检索、长期记忆管理、联网搜索及多模态文件处理等全栈能力,统一封装为轻量可脚本化的命令行入口。开发者完成安装与鉴权后,仅需一行命令,即可在 Claude Code、Qoder、OpenClaw 等所有主流 AI Agent 框架中快速调用全套能力,彻底解决多头对接不同 API、鉴权与参数不统一的开发痛点,大幅降低企业级智能体落地的工程门槛。
VAST获近2亿美元融资 发布世界模型Project Eden
VAST宣布获得近2亿美元融资,并发布世界模型Project Eden。该项目突破传统“动作条件视频生成”与“静态3D场景生成”路径,创造性地将底层状态推演与视觉呈现原生解耦,成为全球首个支持自主维护与确定性控制的世界模型。这一突破解锁了环境长程持久、场景自由复用及多人并发交互等颠覆性能力。Project Eden旨在打造下一代低门槛交互式内容创作底层引擎,并为具身智能等智能体提供高逻辑一致性的训练与评测环境。

国 际 视 野

英伟达发布全球首款全开源全模态物理 AI 大模型 Cosmos 3
英伟达发布全球首款全开源全模态物理 AI 大模型 Cosmos 3。该模型采用混合 Transformer 架构,在统一框架内集成视觉推理、世界仿真与动作预测能力,可原生理解并生成文本、图像、视频、环境音与动作,物理仿真精度达到行业领先水平。Cosmos 3 可将机器人、自动驾驶等物理 AI 系统的训练与评估周期从数月压缩至数天,相关权重与代码已开源开放。英伟达同步发起宇宙联盟,联合全球开发者共同推进下一代世界模型技术发展。
微软亚马逊纷纷跳车,Claude单月账单烧掉34亿
近日,一家企业因未给Anthropic的Claude设置用量上限,单月账单高达5亿美元(约合人民币34亿元)。这一失误导致Token费用持续激增,该笔支出相当于Anthropic当前约470亿美元年化收入的近八分之一。此事件凸显了当前AI“Token经济学”可能并不具备经济性的风险,也引发了业界对大模型使用成本控制的关注。微软、亚马逊等科技巨头此前已因成本问题调整AI策略,此次巨额账单再次敲响了AI应用成本管控的警钟。
全球首个全模态 API 无限期免费开放 覆盖文本图像视频三大能力
全球 Top10 AI 实验室 Agnes AI 正式宣布,旗下全模态核心模型 API 面向全球开发者、创作者无限期免费开放,成为全球首家同时开放三大模态 API 永久免费的 AI 机构。本次开放覆盖 Agnes-2.0-Flash 文本模型、Agnes-Image-2.0-Flash 图像模型、Agnes-Video-V2.0 视频模型,无需绑定信用卡、无调用额度与时长限制。平台依托多模型集群智能路由技术实现极低推理成本,彻底消除中小团队与独立开发者的 AI 调用成本门槛,释放全模态应用创新空间。

行 业 洞 察

企业AI每日使用率72%,但仅18%实现可衡量生产力提升
麦肯锡《2026 State of AI in the Enterprise》调研全球4200名高管发现:72%企业员工每日使用AI工具,但仅18%组织报告AI带来可量化生产力增益。高绩效差异在于三点——结构化Prompt工程培训、重新设计工作流(非叠加原有流程)、设专职AI负责人持续迭代用例。报告结论:技术非瓶颈,人的技能与流程再造才是。多数企业购AI授权却无结构化上岗培训,或仅用于起草邮件等窄场景,导致弃用率高。AI成熟度取决于"AI fluency(AI素养)"建设投入,高增益组织AI技能培训支出是中位数3倍。

趋 势 前 瞻

多智能体系统(MAS)与特定领域语言模型(DSLM)列2026战略趋势核心
Gartner《Top 10 Strategic Tech Trends for 2026》:多智能体系统(MAS)允许多AI Agent交互协作完成单体无法处理的复杂业务流程自动化,企业需预留智能体中台与编排层;特定领域语言模型(DSLM)针对行业定制,垂直场景准确性、合规性与可解释性优于通用LLM,预测2028年企业GenAI模型超半数将是DSLM。同榜列入物理AI(具身智能)、AI安全平台(2028年>50%企业部署)、AI原生开发平台(2030年80%企业借此缩减传统工程团队)、AI超级计算平台(混合CPU/GPU/ASIC编排)。七项趋势直接涉及AI,凸显AI为引领未来变革核心。




夜雨聆风