乐于分享
好东西不私藏

百度DuClaw通过中国信通院可信AI智能助手评估

百度DuClaw通过中国信通院可信AI智能助手评估

随着人工智能技术加速向现实世界场景渗透,以OpenClaw为代表的智能助手正从概念验证迈向规模化应用。智能助手通过将复杂操作指令转化为对本地或远程系统的直接操控,实现从“信息处理”到“任务执行”的能力跨越,成为重塑人机交互范式与产业数字化发展格局的关键动能。中国信息通信研究院(以下简称“中国信通院”)人工智能研究所高度关注智能助手技术及应用发展动态,联合业界多家单位共同编制并发布了智能助手基准测试通用框架,并依据通用框架开展评估工作。

2026年4月,北京百度网讯科技有限公司(以下简称“百度”)参与了中国信通院组织的智能助手(Claw)基准评估,其产品DuClaw V1.0.0通过首批测试并获得了最高评级功能4+级。评估依据《智能助手基准测试通用框架》技术规范,共计3个能力域,16个能力项,围绕基础能力、应用能力和综合能力三方面展开。在基础能力方面,参测产品具备完善的理解交互、逻辑推理、检索核验、规划执行、持续记忆及工具技能使用能力,核心基础能力体系完备、表现均衡稳定;在应用能力方面,参测产品于软件工程、数据分享、文档处理、流程执行等常规办公场景中表现出色,同时在创意写作、文件管理、网页操作等日常任务上,也展现出较高的完成质量;在综合能力方面,参测产品具备良好的多渠道协作与工程运行能力,合规对齐表现较优,所有参测项均符合标准验证要求。

【DuClaw V1.0.0产品介绍】

(以下介绍信息由百度网讯科技提供)

DuClaw是百度智能云推出的OpenClaw系列产品,其核心设计方向为技能与生态的无边界融合,可提供7×24小时不间断服务。该产品通过持续接入各类应用能力,实现生活全场景服务链路的打通,用户在网页端完成订阅后,即可直接启用该产品,目前已兼容百度搜索、百度百科、百度网盘、百度贴吧、百度地图、小度硬件、飞书、钉钉、企业微信、微信、微博及Outlook邮箱日历等多平台、多类型功能服务。用户通过该产品的部署,下达单一出行指令,即可同步调用各类功能服务,操作结果会以语音交互形式实时反馈给用户,形成“Agent指令驱动—软硬件协同调用—物理硬件反馈”的完整服务闭环。从当前产品进展来看,DuClaw正持续扩充接入应用的数量与类型,其发展目标为构建一套可全面适配各类生活场景、支持用户自主选择的“小龙虾”应用开放生态。

图 1  DuClaw V1.0.0

评估介绍

1

基础能力

聚焦智能助手人机交互与任务执行核心环节,评估智能助手在理解交互、逻辑推理、检索核验、规划执行、状态记忆和工具技能等方面的能力。

2

应用能力

聚焦智能助手落地应用实效,评估智能助手在软件工程、数据分析、文档处理、流程执行、创意写作、文件管理和网页操作等方面的能力。

3

综合能力

聚焦智能助手规模化部署与系统化运营,评估智能助手在多渠协作、工程运行和合规对齐等方面的能力。

图2 智能助手基准测试技术规范框架

中国信通院智能助手(Claw)基准测试专项评估工作持续进行中,欢迎各方单位参与。

联系人

李老师,15895989147

liyihao@caict.ac.cn

陶老师,15150591515

taoyue@caict.ac.cn

张老师,19852822678

zhangdan3@caict.ac.cn