Google 正式发布Gemini‑Ultra 推理优化路线图,展示针对长期自主 Agent 工作负载的架构改进计划,重点包括:跨会话记忆、持久任务调度与实时推理流水线优化。据称,未来版本的推理效率相较现有架构提高至少3 倍。推理是 AI 从“训练时代”迈向“实时自治时代”的核心。提升推理效率意味着未来 Agent 能处理更长、更多和更复杂的任务,这将直接改变 AI 在企业和工业应用中的实用性。
02|OpenAI 发布新版“Agent 行为安全白皮书”
OpenAI 正式发布新版Agent 行为安全白皮书,提出 Agent 自主任务分解、长期目标一致性、安全边界约束等一套验证框架,并首次提出“行为沙箱验证模型”概念。这是行业首个面向长期 Agent 安全规范的系统性框架,对未来所有自动执行类 AI 系统提出了统一安全目标基础。
03|Anthropic Claude AutoExec 正式进入企业试点
Anthropic 宣布其最新 Agent 系统Claude AutoExec正式进入多行业企业试点,包括金融风控、自动化云调度和智能客服场景。官方称首次实现“零人工干预下自动完成多阶段复杂任务”。企业级长期自治 AI 正从实验室走向真实业务场景,这标志 AI 从“辅助工具”向“完全自动执行系统”跨越。
04|国际AI伦理组织发布自主 Agent 风险指标集
由多家领先 AI 安全与伦理组织联合发布了第一版自主 Agent 风险指标集,包括目标漂移概率、资源竞争风险、策略稳定性等 8 项指标,旨在为全球监管提供量化风险评估标准。AI 风险治理正在从抽象伦理讨论进入可量化标准制定阶段,这将影响未来全球监管政策与企业安全测试流程。
05|欧洲启动首个跨境 AI 风险检测平台
欧盟宣布成立跨境 AI 风险检测平台(European AI Risk Detection Network),用于实时监测高风险 AI 系统行为、Agent 自动化决策链及潜在滥用场景,并与成员国安全机构实时共享数据。未来 AI 安全治理不再单一国家行为,而正进入国际协作阶段。这可能成为全球 AI 监管协调的重要基础设施。
06|英国政府发布 AI 产业自主性战略报告
英国政府发布了AI 产业自主性战略报告,提出重点支持本国 AI 产业生态基础设施建设、协同计算平台和开源智能体生态,同时强调对 Agent 自主性能力设定可控性基线。各国政府已不仅关注 AI 商业竞争,更将 AI 自主性和可控性纳入国家战略,反映 AI 与国家经济、社会安全深度耦合趋势。