随着人工智能技术加速向现实世界场景渗透,以OpenClaw为代表的智能助手正从概念验证迈向规模化应用。智能助手通过将复杂操作指令转化为对本地或远程系统的直接操控,实现从“信息处理”到“任务执行”的能力跨越,成为重塑人机交互范式与产业数字化发展格局的关键动能。中国信息通信研究院(以下简称“中国信通院”)人工智能研究所高度关注智能助手技术及应用发展动态,联合业界多家单位共同编制并发布了智能助手基准测试通用框架,并依据通用框架开展评估工作。
2026年4月,百度智能云参与了中国信通院组织的智能助手(Claw)基准测试,其产品RedClaw 1.0.013通过首批测试并获得了当前最高评分功能4+级。评估依据《智能助手基准测试通用框架》技术规范,共计3个能力域,16个能力项,围绕基础能力、应用能力和综合能力三方面展开。在基础能力方面,参测产品具备优秀的逻辑推理、检索核验及规划执行能力,推理链路清晰、查证准确度高、任务拆解合理,核心基础能力扎实突出;在应用能力方面,产品于数据分析、文档处理及文件管理等移动办公场景中表现良好,同时凭借对手机端生态的深度嵌入,实现了与系统及第三方应用间的流畅协同,显著提升操作效率;在综合能力方面,产品具备良好的端侧运行稳定性与合规对齐表现,所有参测项均符合标准验证要求。
百度RedClaw产品介绍
(以下介绍信息由百度智能云提供)
RedClaw作为全球首款原生移动端OpenClaw应用,颠覆传统AI助手形态,打造面向普通用户的零门槛、免部署手机端AI操作型智能体。依托大模型与灵活可扩展Skill技能体系,它实现AI从“被动回答”到“主动执行手机任务”的跨越,通过云端虚拟手机、VLA多模态大模型及OpenClaw框架,在云端安全环境完成跨App复杂操作,兼顾功能强大与物理级隐私隔离。其核心功能覆盖四大维度:自然语言一键指令,语音/文字即可让AI模拟真人触屏操作;跨App自动化执行,自动跳转完成订票、比价、签到等闭环任务;按需安装多领域Skill,适配信息查询、内容创作、生活娱乐等场景。这款助手有效地降低了AI使用门槛,无需掌握专业技术配置,就能让AI自动完成日程管理、内容生成、设备联动等全流程任务,成为高效便捷的个人专属助手。

图1 百度RedClaw产品使用截图
(左一:产品首页、左二:定时任务、左三:技能管理、左四:灵感广场)
评估介绍
1
基础能力
聚焦智能助手人机交互与任务执行核心环节,评估智能助手在理解交互、逻辑推理、检索核验、规划执行、状态记忆和工具技能等方面的能力。
2
应用能力
聚焦智能助手落地应用实效,评估智能助手在软件工程、数据分析、文档处理、流程执行、创意写作、文件管理和网页操作等方面的能力。
3
综合能力
聚焦智能助手规模化部署与系统化运营,评估智能助手在多渠协作、工程运行和合规对齐等方面的能力。

图2 智能助手基准测试技术规范框架
中国信通院智能助手(Claw)基准测试专项评估工作持续进行中,欢迎各方单位参与。
联系人
陶老师,15150591515(微信同号)
taoyue@caict.ac.cn
王老师,18800150730(微信同号)
wangqian6@caict.ac.cn
张老师,19852822678(微信同号)
zhangdan3@caict.ac.cn
夜雨聆风