OpenClaw移动版上线&OpenAI为Codex预告新硬件【AI 前沿 2026-06-30】
☀️ 今日速览 · 8 条2026-06-30
AI 简报
🛠 工具生态
– – – – – – – – – –
OpenClaw 移动版上线 iOS 和 Android#1
vLLM推Micro-Agent路由,单API调多模型协作#2
Amazon Bedrock AgentCore 推出可观测性功能#3
🔮 前瞻传闻
– – – – – – – – – –
OpenAI联合Work Louder推出Codex硬件设备#4
🧠 模型相关
– – – – – – – – – –
Gemini个性化图像生成向美国用户免费开放#5
📡 行业动态
– – – – – – – – – –
OceanBase发布湖库一体AI数据库#6
Anthropic Claude在Azure上运行NVIDIA GB300#7
Palantir用NVIDIA Nemotron为美政府建安全AI#8
#1 OpenClaw 移动版上线 iOS 和 Android
⚡ OpenClaw 推出原生移动应用,现已上架苹果 App Store 和谷歌 Play 商店。
OpenClaw 发布原生移动应用,支持 iOS 和 Android 平台。
• 上线时间:应用已于近期上架。
• iOS 版本:App Store 下载链接为 https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132
• Android 版本:Google Play 下载链接为 https://play.google.com/store/apps/details?id=ai.openclaw.app
• 功能描述:用户可通过移动端管理频道、任务和回复,运行智能代理。

#2 vLLM推Micro-Agent路由,单API调多模型协作
⚡ vLLM Semantic Router 发布 Micro-Agent 功能,通过单模型 API 调用实现多模型协作,在三个基准上超越前沿模型。
vLLM 团队于 2026 年 6 月 29 日发布 vLLM Semantic Router 的 Micro-Agent 功能,将多模型协作封装为单一 OpenAI 兼容 API 调用。
• 核心机制:用户调用 vllm-sr/auto 模型名,路由器内部根据任务选择协作模式(Recipe),执行多模型并行/串行推理、聚合、合成后返回单一响应。
六种协作模式(Looper):
• Confidence:先调用低成本模型,置信度不足时升级到更强模型。
• Ratings:在并发上限内并行调用多个模型,按质量评分加权聚合。
• ReMoM:多模型并行推理,达到最低成功数后由合成模型合并结果。
• Fusion:独立模型回答作为证据,由评判模型分析分歧后合成最终答案。
• Workflows:支持规划器、补丁器、验证器等角色,在预算和步骤上限内执行。
• Auto recipes:根据请求难度、风险、延迟等信号自动选择上述模式。
#3 Amazon Bedrock AgentCore 推出可观测性功能
⚡ AWS 发布 Amazon Bedrock AgentCore 可观测性功能,通过指标、追踪和结构化日志调试生产环境 AI Agent。
AWS 于 2026 年 6 月 29 日发布 Amazon Bedrock AgentCore 可观测性功能,用于调试生产环境中的 AI Agent。
• 三层可观测性:通过 Amazon CloudWatch 仪表盘、OpenTelemetry 追踪和结构化日志,提供指标、追踪和日志三个层面的可见性。
• 追踪执行流程:可查看每个推理步骤、工具调用、记忆检索及最终输出,定位执行偏离预期之处。
• 关键指标:包括性能(50/95/99 百分位延迟)、资源(会话时长、并发会话、Token 用量)和可靠性(按类型区分的错误率)。
• 启用方式:需在 CloudWatch 中开启 Transaction Search,数据默认路由至 CloudWatch,也可导出至 Datadog、Grafana Cloud 或 Elastic Observability。
• 调试场景:针对无限循环和工具调用失败两类常见故障提供诊断工作流,包含 CloudWatch Logs Insights 查询示例。
• 无限循环根因:提示词设计缺陷(缺少终止条件)、循环检测缺失、工具选择错误。
• 工具调用失败类型:认证错误(401)、授权错误(403)、验证错误(400)、资源未找到(404)、工具执行错误(500)。
• 主动监控:可将诊断查询转为持久化仪表盘和告警,并支持 AgentCore Evaluators 进行持续自动化评估。
• 后续内容:本文为系列第一部分,第二部分将覆盖性能优化和内存管理。
#4 OpenAI联合Work Louder推出Codex硬件设备
⚡ OpenAI将于7月15日发布一款与Codex编程工具配合使用的硬件设备,由Work Louder合作制造。
• 发布方:OpenAI与Work Louder(机械键盘与宏键盘制造商)合作。
• 产品定位:一款与AI编程工具Codex配合使用的硬件设备。
• 外观信息:视频展示为方形设备,带有多个按钮。其轮廓类似Work Louder的Creator Micro 2宏键盘(含13个机械开关、一个摇杆和一个触控传感器)。
• 功能特点:用户可为不同应用(如Photoshop)中的开关分配快捷键和自定义操作。Codex设备将预配置Codex相关快捷键。
• 发布时间:2026年7月15日。
• 背景说明:该设备并非OpenAI与Jony Ive合作的神秘AI设备。
• 类似案例:Figma曾与Work Louder合作推出预配置快捷键的宏键盘。
#5 Gemini个性化图像生成向美国用户免费开放
⚡ Google宣布Gemini应用的Nano Banana个性化图像生成功能即日起向所有美国用户免费开放。
Google于2026年6月29日宣布,Gemini应用的个性化图像生成功能(基于Nano Banana模型)即日起向所有美国合格用户免费开放,此前该功能仅限Plus、Pro和Ultra订阅用户使用。
• 功能原理:利用用户Google账户连接的数据(如Gmail、Google Photos、YouTube和搜索记录)生成反映个人兴趣的图像,无需在提示中手动指定偏好。
• 使用示例:用户只需说“创建一张我和我最喜欢的东西的插图”,Gemini即可自动识别用户喜好(如咖啡、烘焙),并可从Google Photos中直接调用用户照片。
• 隐私控制:该功能为可选加入(opt-in),用户可决定Gemini可访问哪些应用;启用后默认应用于每次提示,但可通过“工具”菜单中的新开关随时关闭。
• 历史扩展:Google于今年3月向所有美国用户开放Personal Intelligence功能,近期已扩展至印度和日本用户。
• 其他更新:上月Google还预告了Gemini应用的未来更新,包括“Daily Brief”功能、界面改版、AI视频模型Gemini Omni以及个人AI代理Gemini Spark。
• 用户规模:Google的AI聊天机器人Gemini月活跃用户数(MAU)已于今年早些时候突破7.5亿。
#6 OceanBase发布湖库一体AI数据库
⚡ OceanBase于6月29日发布AI数据库,以湖库一体架构融合多模态数据,并推出Lakebase、DataStudio、DataPilot等产品。
6月29日,OceanBase发布面向AI时代的湖库一体AI数据库。
• 核心架构:以湖库一体为核心,将数据湖的开放与海量存储能力、数据库的事务处理与分析能力、多模态数据处理能力统一到一套强一致的数据底座上。
• 产品体系:
• OceanBase Lakebase:底层引擎,统一管理结构化、非结构化和向量数据。
• OceanBase DataStudio:覆盖数据接入、加工、编排、语义建模到Agent协作,将数据资产转化为数据服务。
• OceanBase DataPilot:企业业务智能入口,支持自然语言生成分析报告、数据看板和可信答案。
• 成本与验证:相较传统多系统方案,可降低整体TCO约30%-50%。已在蚂蚁阿福、灵光等场景完成验证,其中灵光累计生成数千万个“闪应用”。
• 公司背景:OceanBase起源于2010年,已服务超400家金融机构,连续两年位居中国分布式数据库本地部署市场第一,是唯一同时登顶TPC-C和TPC-H两项国际权威测试的数据库。
#7 Anthropic Claude在Azure上运行NVIDIA GB300
⚡ Anthropic的Claude模型在Microsoft Foundry中正式可用,运行于NVIDIA GB300 Blackwell Ultra GPU上。
Anthropic的Claude模型在Microsoft Foundry中正式可用,运行于Azure上的NVIDIA GB300 Blackwell Ultra GPU。
• 发布方与时间:NVIDIA于2026年6月29日通过官方博客宣布。
• 产品与版本:Anthropic的Claude模型在Microsoft Foundry中,运行于NVIDIA GB300 Blackwell Ultra GPU,采用NVIDIA GB300 NVL72系统和NVIDIA Quantum-X800 InfiniBand网络。
• 可用范围:面向Azure原生企业用户,在Microsoft Foundry中正式可用。
• 合作背景:基于微软、NVIDIA和Anthropic于2025年11月宣布的战略合作,旨在扩大企业访问Claude的渠道,并在NVIDIA加速计算上提供Anthropic模型。
• 集成工具:NVIDIA将NVIDIA工具集成到Anthropic技术栈中,使企业可通过NVIDIA验证的代理技能为Claude代理赋予领域特定能力。
• 参考设计:企业可使用NVIDIA Secure Agent Workspace Reference Design在Azure上运行Claude代理,该设计提供在基础设施层面控制身份、网络访问、凭证和运行时策略的蓝图。

#8 Palantir用NVIDIA Nemotron为美政府建安全AI
⚡ Palantir发布新智能引擎,集成NVIDIA Nemotron开源模型,为美国政府部门在隔离环境中提供定制化AI。
Palantir发布新智能引擎,集成NVIDIA Nemotron开源模型,服务美国政府部门。
• 发布方与时间:Palantir于2026年6月29日宣布推出新智能引擎。
• 核心模型:使用NVIDIA Nemotron开源模型。
• 部署环境:模型运行于气隙环境(与未安全网络完全隔离的设施),基于NVIDIA加速计算。
• 服务对象:美国政府部门及关键基础设施运营商。
• 定制与所有权:机构可在自有基础设施上运行定制化Nemotron模型,使用自有数据训练,并完全拥有结果模型(包括编码操作知识的权重)。
• 支撑平台:Palantir的Sovereign AI Operating System(基于AIP、Ontology、Foundry和Apollo)负责操作与数据授权层,支持显式数据授权、架构强制隔离和完整审计。
• 持续优化:模型在生产中可通过新数据和反馈在客户环境中持续改进。
• 企业级支持:可通过NVIDIA AI Enterprise软件套件获得企业级部署支持。
── 2026-06-30 ──
夜雨聆风