乐于分享
好东西不私藏

让喵伴接入 OpenClaw:把语音设备变成可调用本地 Agent 的入口

让喵伴接入 OpenClaw:把语音设备变成可调用本地 Agent 的入口

接入 OpenClaw 并不是替换喵伴原有的小智能力,而是在原有语音对话基础上增加了一条“任务执行通道”。普通聊天时,喵伴仍然按照原来的对话流程进行问答;当用户说出约定好的触发词,比如“打开 OpenClaw”“帮我执行任务”等(在下面的演示视频中,我们设置的触发词是“通用助手”),系统会把这句话识别为 OpenClaw 请求,并通过桥接服务转发给 OpenClaw。

OpenClaw 接收到任务后,会调用对应 Agent 和工具完成处理,最后再把执行结果返回给喵伴,由喵伴用语音播报给用户。也就是说,喵伴负责自然交互,OpenClaw 负责复杂执行,两者通过触发词完成智能路由和双向通信。

已关注

关注

重播 分享

一、这个能力本质上实现了什么?

简单来说,它实现的是:

喵伴负责“听”和“说”         OpenClaw 负责“理解”和“执行”         桥接服务负责“连接”和“状态流转”

这样一来,喵伴就可以从一个语音交互终端,升级为一个可以调用本地电脑、业务系统、浏览器自动化、内容生成工具和专属 Agent 的智能入口。

二、整体通信架构

整个通信链路可以理解为一条“语音任务流水线”:

喵伴设备语音入口

自建喵伴后台 / MCP 能力层

OpenClaw Voice Bridge 桥接服务

OpenClaw Gateway

指定 Agent / Skills / Tools

执行结果返回喵伴播报

这个架构最大的好处是:喵伴设备不需要直接改成一个复杂的 Agent 系统,它只需要把用户的话送出去,再把结果播出来。真正复杂的任务理解、工具调用、流程执行,都交给 OpenClaw 完成。

三、三个核心角色

1. 喵伴:语音入口

喵伴主要负责用户交互,包括语音唤醒、语音识别、语音播报和基础设备状态展示。它是用户最自然的入口。

2. 桥接服务:通信中枢

桥接服务负责接收喵伴后台传来的文本请求,创建任务,记录设备和用户关系,转发给 OpenClaw,并在 OpenClaw 完成任务后保存结果,等待喵伴取回。

3. OpenClaw:执行大脑

OpenClaw 负责把用户的话变成可执行任务,例如调用浏览器、读取网页、执行本地脚本、触发业务流程、操作指定 Agent,最终生成可以返回给用户的结果。

四、一次完整对话是如何完成的?

第一步:用户对喵伴说话

例如用户说:“帮我问一下 OpenClaw,今天有哪些退款任务需要处理?”(当识别到触发词(openclaw等)后,路由)

第二步:小智后台把语音转成文本

喵伴或小智后台完成语音识别后,把文本、设备 ID、用户 ID 一起发送给桥接服务。

第三步:桥接服务创建任务

桥接服务会生成一个任务 ID,把这次请求保存下来,并标记它来自哪个设备、哪个用户、哪个 OpenClaw 会话。

第四步:OpenClaw Agent 执行任务

OpenClaw 接收到任务后,会根据内容选择对应 Agent 和工具。

第五步:结果返回喵伴播报

任务完成后,结果会回到桥接服务,再由喵伴后台取回,最终通过喵伴用语音说出来。

五、为什么一定要有桥接服务?

喵伴和 OpenClaw 两边承担的职责完全不同。

喵伴更像是“前台接待”,OpenClaw 更像是“后台执行团队”,桥接服务就是中间的“任务分发台”,并且此桥接服务不会影响正常的喵伴对话内容,只有当用户语句匹配到对应触发词后才会走openclaw这个桥接服务通道。

有了桥接服务之后,可以解决几个关键问题:

第一,解耦。设备端不用频繁修改,OpenClaw 能力升级也不会影响喵伴基础功能。

第二,支持异步。有些任务不是马上完成的,桥接服务可以先保存任务,等执行完再通知设备。

第三,支持多用户绑定。每个用户、每台设备都可以绑定自己的 OpenClaw 会话。

第四,便于权限控制。不同用户可以访问不同 Agent,不同设备可以拥有不同能力范围。

六、如何实现每个用户自己的喵伴和 OpenClaw 配对?

这部分的关键是建立一套绑定关系。

一台喵伴设备对应一个 device_id

一个用户对应一个 user_id

一个 OpenClaw 会话对应一个 session_id

一个业务能力对应一个 agent_id

七、它真正打开的价值

它真正实现的是:         让一个语音设备,拥有调用本地 Agent 的能力。

这意味着,喵伴不再只是回答天气、新闻、笑话,而是可以进一步连接到真实业务流程:

可以通过语音触发 OpenClaw 写文章、查资料、生成内容;

可以通过语音让 OpenClaw 操作浏览器、检查订单、处理退款;

可以把企业内部的专属 Agent 封装成语音能力;

可以让设备主动播报任务结果、异常提醒和处理状态。

八、最终效果是什么?

最终,用户面对的体验会非常简单:

用户说一句话(触发到openclaw)

喵伴听懂并上传

OpenClaw 执行任务

喵伴把结果说出来

对用户来说,它像是一个会说话的智能助手;但在系统背后,它其实已经连接到了一个可以真正执行任务的 Agent 网络。

关于赛博科技

赛博科技是一家集研发、设计、生产于一体的国家科技型企业,专注于人工智能硬件产品与融合 AI 大模型的端到端 AIoT 一体化解决方案。公司通过 ISO 质量管理体系认证,拥有多项知识产权,研发人员占比高,具备从产品定义、方案设计到量产交付的完整能力。

目前,赛博科技产品与服务已覆盖 AI 玩具、智能家居、工业控制、医疗及消费电子等多个细分领域,服务全球 200+ 企业客户,持续推动 AI 从概念走向设备、从模型走向场景、从能力走向真正可交付的产品价值。