百度RedClaw通过中国信通院可信AI智能助手评估

随着人工智能技术加速向现实世界场景渗透，以OpenClaw为代表的智能助手正从概念验证迈向规模化应用。智能助手通过将复杂操作指令转化为对本地或远程系统的直接操控，实现从“信息处理”到“任务执行”的能力跨越，成为重塑人机交互范式与产业数字化发展格局的关键动能。中国信息通信研究院（以下简称“中国信通院”）人工智能研究所高度关注智能助手技术及应用发展动态，联合业界多家单位共同编制并发布了智能助手基准测试通用框架，并依据通用框架开展评估工作。

2026年4月，百度智能云参与了中国信通院组织的智能助手（Claw）基准测试，其产品RedClaw 1.0.013通过首批测试并获得了当前最高评分功能4+级。评估依据《智能助手基准测试通用框架》技术规范，共计3个能力域，16个能力项，围绕基础能力、应用能力和综合能力三方面展开。在基础能力方面，参测产品具备优秀的逻辑推理、检索核验及规划执行能力，推理链路清晰、查证准确度高、任务拆解合理，核心基础能力扎实突出；在应用能力方面，产品于数据分析、文档处理及文件管理等移动办公场景中表现良好，同时凭借对手机端生态的深度嵌入，实现了与系统及第三方应用间的流畅协同，显著提升操作效率；在综合能力方面，产品具备良好的端侧运行稳定性与合规对齐表现，所有参测项均符合标准验证要求。

百度RedClaw产品介绍

（以下介绍信息由百度智能云提供）

RedClaw作为全球首款原生移动端OpenClaw应用，颠覆传统AI助手形态，打造面向普通用户的零门槛、免部署手机端AI操作型智能体。依托大模型与灵活可扩展Skill技能体系，它实现AI从“被动回答”到“主动执行手机任务”的跨越，通过云端虚拟手机、VLA多模态大模型及OpenClaw框架，在云端安全环境完成跨App复杂操作，兼顾功能强大与物理级隐私隔离。其核心功能覆盖四大维度：自然语言一键指令，语音/文字即可让AI模拟真人触屏操作；跨App自动化执行，自动跳转完成订票、比价、签到等闭环任务；按需安装多领域Skill，适配信息查询、内容创作、生活娱乐等场景。这款助手有效地降低了AI使用门槛，无需掌握专业技术配置，就能让AI自动完成日程管理、内容生成、设备联动等全流程任务，成为高效便捷的个人专属助手。

图1 百度RedClaw产品使用截图

（左一：产品首页、左二：定时任务、左三：技能管理、左四：灵感广场）

评估介绍

基础能力

聚焦智能助手人机交互与任务执行核心环节，评估智能助手在理解交互、逻辑推理、检索核验、规划执行、状态记忆和工具技能等方面的能力。

应用能力

聚焦智能助手落地应用实效，评估智能助手在软件工程、数据分析、文档处理、流程执行、创意写作、文件管理和网页操作等方面的能力。

综合能力

聚焦智能助手规模化部署与系统化运营，评估智能助手在多渠协作、工程运行和合规对齐等方面的能力。

图2 智能助手基准测试技术规范框架

中国信通院智能助手（Claw）基准测试专项评估工作持续进行中，欢迎各方单位参与。

联系人

陶老师，15150591515（微信同号）

taoyue@caict.ac.cn

王老师，18800150730（微信同号）

wangqian6@caict.ac.cn

张老师，19852822678（微信同号）

zhangdan3@caict.ac.cn