百度搭子DuMate通过中国信通院可信AI智能助手评估
随着人工智能技术加速向现实世界场景渗透,以OpenClaw为代表的智能助手正从概念验证迈向规模化应用。智能助手通过将复杂操作指令转化为对本地或远程系统的直接操控,实现从“信息处理”到“任务执行”的能力跨越,成为重塑人机交互范式与产业数字化发展格局的关键动能。中国信息通信研究院(以下简称“中国信通院”)人工智能研究所高度关注智能助手技术及应用发展动态,联合业界多家单位共同编制并发布了智能助手基准测试通用框架,并依据规范内容开展评估工作。
2026年4月,北京百度网讯科技有限公司(以下简称“百度”)参与了中国信通院组织的智能助手(Claw)基准测试,其产品搭子DuMate V1.0.21通过首批测试并获得了当前最高评级功能4+级。评估依据《智能助手基准测试通用框架》技术规范,共计3个能力域,16个能力项,围绕基础能力、应用能力和综合能力三方面展开。在基础能力方面,参测产品具备较完善的理解交互与执行规划能力,在复杂任务场景中具备任务规划、步骤组织以及执行过程管理的能力;在应用能力方面,参测产品具备一定的场景丰富度,在软件工程、数据分析、文件管理等任务中展现出较高的完成质量,具备端到端执行任务的能力;在综合能力方面,参测产品具备良好的工程化部署水平,并通过授权验证、数据不出域、操作审计等方式保障系统的安全稳定。
【百度搭子DuMate产品介绍】
(以下介绍信息由北京百度网讯科技有限公司提供)
百度搭子DuMate V1.0.21是由百度智能云开发的人工智能助手,其采用自然语言交互方式,可执行跨应用、跨文件的任务处理,实现从指令理解到任务执行的流程闭环。该产品具备记忆功能,能够在持续使用过程中学习用户的工作习惯与任务偏好,以提升交互准确性。百度搭子DuMate可应用于个人效率提升及企业标准化流程构建场景,通过持续协作优化用户适配度。

图1 百度搭子DuMate产品界面
【智能助手(Claw)评估介绍】
1
基础能力
聚焦智能助手人机交互与任务执行核心环节,评估智能助手在理解交互、逻辑推理、检索核验、规划执行、状态记忆和工具技能等方面的能力。
2
应用能力
聚焦智能助手落地应用实效,评估智能助手在软件工程、数据分析、文档处理、流程执行、创意写作、文件管理和网页操作等方面的能力。
3
综合能力
聚焦智能助手规模化部署与系统化运营,评估智能助手在多渠协作、工程运行和合规对齐等方面的能力。

图2 智能助手基准测试技术规范框架
中国信通院智能助手(Claw)基准测试专项评估工作持续进行中,欢迎各方单位参与。
联系人
王老师,18800150730(微信同号)
wangqian6@caict.ac.cn
陶老师,15150591515(微信同号)
taoyue@caict.ac.cn
张老师,19852822678(微信同号)
zhangdan3@caict.ac.cn
夜雨聆风