OpenClaw移动版上线&OpenAI为Codex预告新硬件【AI 前沿 2026-06-30】-夜雨聆风

OpenClaw移动版上线&OpenAI为Codex预告新硬件【AI 前沿 2026-06-30】

☀️ 今日速览 · 8 条2026-06-30

AI 简报

🛠 工具生态
– – – – – – – – – –

OpenClaw 移动版上线 iOS 和 Android#1

vLLM推Micro-Agent路由，单API调多模型协作#2

Amazon Bedrock AgentCore 推出可观测性功能#3

🔮 前瞻传闻
– – – – – – – – – –

OpenAI联合Work Louder推出Codex硬件设备#4

🧠 模型相关
– – – – – – – – – –

Gemini个性化图像生成向美国用户免费开放#5

📡 行业动态
– – – – – – – – – –

OceanBase发布湖库一体AI数据库#6

Anthropic Claude在Azure上运行NVIDIA GB300#7

Palantir用NVIDIA Nemotron为美政府建安全AI#8

#1 OpenClaw 移动版上线 iOS 和 Android

⚡ OpenClaw 推出原生移动应用，现已上架苹果 App Store 和谷歌 Play 商店。

OpenClaw 发布原生移动应用，支持 iOS 和 Android 平台。

• 上线时间：应用已于近期上架。

• iOS 版本：App Store 下载链接为 https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132

• Android 版本：Google Play 下载链接为 https://play.google.com/store/apps/details?id=ai.openclaw.app

• 功能描述：用户可通过移动端管理频道、任务和回复，运行智能代理。

#2 vLLM推Micro-Agent路由，单API调多模型协作

⚡ vLLM Semantic Router 发布 Micro-Agent 功能，通过单模型 API 调用实现多模型协作，在三个基准上超越前沿模型。

vLLM 团队于 2026 年 6 月 29 日发布 vLLM Semantic Router 的 Micro-Agent 功能，将多模型协作封装为单一 OpenAI 兼容 API 调用。

• 核心机制：用户调用 vllm-sr/auto 模型名，路由器内部根据任务选择协作模式（Recipe），执行多模型并行/串行推理、聚合、合成后返回单一响应。

六种协作模式（Looper）：

• Confidence：先调用低成本模型，置信度不足时升级到更强模型。

• Ratings：在并发上限内并行调用多个模型，按质量评分加权聚合。

• ReMoM：多模型并行推理，达到最低成功数后由合成模型合并结果。

• Fusion：独立模型回答作为证据，由评判模型分析分歧后合成最终答案。

• Workflows：支持规划器、补丁器、验证器等角色，在预算和步骤上限内执行。

• Auto recipes：根据请求难度、风险、延迟等信号自动选择上述模式。

#3 Amazon Bedrock AgentCore 推出可观测性功能

⚡ AWS 发布 Amazon Bedrock AgentCore 可观测性功能，通过指标、追踪和结构化日志调试生产环境 AI Agent。

AWS 于 2026 年 6 月 29 日发布 Amazon Bedrock AgentCore 可观测性功能，用于调试生产环境中的 AI Agent。

• 三层可观测性：通过 Amazon CloudWatch 仪表盘、OpenTelemetry 追踪和结构化日志，提供指标、追踪和日志三个层面的可见性。

• 追踪执行流程：可查看每个推理步骤、工具调用、记忆检索及最终输出，定位执行偏离预期之处。

• 关键指标：包括性能（50/95/99 百分位延迟）、资源（会话时长、并发会话、Token 用量）和可靠性（按类型区分的错误率）。

• 启用方式：需在 CloudWatch 中开启 Transaction Search，数据默认路由至 CloudWatch，也可导出至 Datadog、Grafana Cloud 或 Elastic Observability。

• 调试场景：针对无限循环和工具调用失败两类常见故障提供诊断工作流，包含 CloudWatch Logs Insights 查询示例。

• 无限循环根因：提示词设计缺陷（缺少终止条件）、循环检测缺失、工具选择错误。

• 工具调用失败类型：认证错误（401）、授权错误（403）、验证错误（400）、资源未找到（404）、工具执行错误（500）。

• 主动监控：可将诊断查询转为持久化仪表盘和告警，并支持 AgentCore Evaluators 进行持续自动化评估。

• 后续内容：本文为系列第一部分，第二部分将覆盖性能优化和内存管理。

#4 OpenAI联合Work Louder推出Codex硬件设备

⚡ OpenAI将于7月15日发布一款与Codex编程工具配合使用的硬件设备，由Work Louder合作制造。

• 发布方：OpenAI与Work Louder（机械键盘与宏键盘制造商）合作。

• 产品定位：一款与AI编程工具Codex配合使用的硬件设备。

• 外观信息：视频展示为方形设备，带有多个按钮。其轮廓类似Work Louder的Creator Micro 2宏键盘（含13个机械开关、一个摇杆和一个触控传感器）。

• 功能特点：用户可为不同应用（如Photoshop）中的开关分配快捷键和自定义操作。Codex设备将预配置Codex相关快捷键。

• 发布时间：2026年7月15日。

• 背景说明：该设备并非OpenAI与Jony Ive合作的神秘AI设备。

• 类似案例：Figma曾与Work Louder合作推出预配置快捷键的宏键盘。

#5 Gemini个性化图像生成向美国用户免费开放

⚡ Google宣布Gemini应用的Nano Banana个性化图像生成功能即日起向所有美国用户免费开放。

Google于2026年6月29日宣布，Gemini应用的个性化图像生成功能（基于Nano Banana模型）即日起向所有美国合格用户免费开放，此前该功能仅限Plus、Pro和Ultra订阅用户使用。

• 功能原理：利用用户Google账户连接的数据（如Gmail、Google Photos、YouTube和搜索记录）生成反映个人兴趣的图像，无需在提示中手动指定偏好。

• 使用示例：用户只需说“创建一张我和我最喜欢的东西的插图”，Gemini即可自动识别用户喜好（如咖啡、烘焙），并可从Google Photos中直接调用用户照片。

• 隐私控制：该功能为可选加入（opt-in），用户可决定Gemini可访问哪些应用；启用后默认应用于每次提示，但可通过“工具”菜单中的新开关随时关闭。

• 历史扩展：Google于今年3月向所有美国用户开放Personal Intelligence功能，近期已扩展至印度和日本用户。

• 其他更新：上月Google还预告了Gemini应用的未来更新，包括“Daily Brief”功能、界面改版、AI视频模型Gemini Omni以及个人AI代理Gemini Spark。

• 用户规模：Google的AI聊天机器人Gemini月活跃用户数（MAU）已于今年早些时候突破7.5亿。

#6 OceanBase发布湖库一体AI数据库

⚡ OceanBase于6月29日发布AI数据库，以湖库一体架构融合多模态数据，并推出Lakebase、DataStudio、DataPilot等产品。

6月29日，OceanBase发布面向AI时代的湖库一体AI数据库。

• 核心架构：以湖库一体为核心，将数据湖的开放与海量存储能力、数据库的事务处理与分析能力、多模态数据处理能力统一到一套强一致的数据底座上。

• 产品体系：

• OceanBase Lakebase：底层引擎，统一管理结构化、非结构化和向量数据。

• OceanBase DataStudio：覆盖数据接入、加工、编排、语义建模到Agent协作，将数据资产转化为数据服务。

• OceanBase DataPilot：企业业务智能入口，支持自然语言生成分析报告、数据看板和可信答案。

• 成本与验证：相较传统多系统方案，可降低整体TCO约30%-50%。已在蚂蚁阿福、灵光等场景完成验证，其中灵光累计生成数千万个“闪应用”。

• 公司背景：OceanBase起源于2010年，已服务超400家金融机构，连续两年位居中国分布式数据库本地部署市场第一，是唯一同时登顶TPC-C和TPC-H两项国际权威测试的数据库。

#7 Anthropic Claude在Azure上运行NVIDIA GB300

⚡ Anthropic的Claude模型在Microsoft Foundry中正式可用，运行于NVIDIA GB300 Blackwell Ultra GPU上。

Anthropic的Claude模型在Microsoft Foundry中正式可用，运行于Azure上的NVIDIA GB300 Blackwell Ultra GPU。

• 发布方与时间：NVIDIA于2026年6月29日通过官方博客宣布。

• 产品与版本：Anthropic的Claude模型在Microsoft Foundry中，运行于NVIDIA GB300 Blackwell Ultra GPU，采用NVIDIA GB300 NVL72系统和NVIDIA Quantum-X800 InfiniBand网络。

• 可用范围：面向Azure原生企业用户，在Microsoft Foundry中正式可用。

• 合作背景：基于微软、NVIDIA和Anthropic于2025年11月宣布的战略合作，旨在扩大企业访问Claude的渠道，并在NVIDIA加速计算上提供Anthropic模型。

• 集成工具：NVIDIA将NVIDIA工具集成到Anthropic技术栈中，使企业可通过NVIDIA验证的代理技能为Claude代理赋予领域特定能力。

• 参考设计：企业可使用NVIDIA Secure Agent Workspace Reference Design在Azure上运行Claude代理，该设计提供在基础设施层面控制身份、网络访问、凭证和运行时策略的蓝图。

#8 Palantir用NVIDIA Nemotron为美政府建安全AI

⚡ Palantir发布新智能引擎，集成NVIDIA Nemotron开源模型，为美国政府部门在隔离环境中提供定制化AI。

Palantir发布新智能引擎，集成NVIDIA Nemotron开源模型，服务美国政府部门。

• 发布方与时间：Palantir于2026年6月29日宣布推出新智能引擎。

• 核心模型：使用NVIDIA Nemotron开源模型。

• 部署环境：模型运行于气隙环境（与未安全网络完全隔离的设施），基于NVIDIA加速计算。

• 服务对象：美国政府部门及关键基础设施运营商。

• 定制与所有权：机构可在自有基础设施上运行定制化Nemotron模型，使用自有数据训练，并完全拥有结果模型（包括编码操作知识的权重）。

• 支撑平台：Palantir的Sovereign AI Operating System（基于AIP、Ontology、Foundry和Apollo）负责操作与数据授权层，支持显式数据授权、架构强制隔离和完整审计。

• 持续优化：模型在生产中可通过新数据和反馈在客户环境中持续改进。

• 企业级支持：可通过NVIDIA AI Enterprise软件套件获得企业级部署支持。

── 2026-06-30 ──