乐于分享
好东西不私藏

OpenClaw(龙虾)端侧AI智能体框架 探索研究总结

OpenClaw(龙虾)端侧AI智能体框架 探索研究总结

OpenClaw(龙虾)|端侧AI智能体框架

OpenClaw: 开源本地优先端侧AI Agent网关,不内置大模型,把本地端侧大模型(Ollama/LMStudio)和系统、聊天软件打通,让AI在本机读文件、跑脚本、操控电脑、自动干活,纯端侧离线运行

MIT开源、TS开发、外号小龙虾,2025年底开源,主打端侧私有化+AI工具执行,是当下端侧智能体标杆。

一、核心定位(端侧属性)

Local-First本地优先 = 纯正端侧架构
全部会话、记忆、任务日志存在本机硬盘(Markdown/JSON),数据不出设备、不上第三方云端;可完全断网离线使用本地大模型(Llama3、Qwen、Mistral量化版)。
角色:AI手脚调度中枢
本身不是推理引擎,对接端侧推理(Ollama/NCNN/ONNX)+ 操作系统接口
大脑:本地端侧大模型(本机NPU/GPU跑)
手脚:OpenClaw接管Shell、文件、浏览器、软件调用、API自动化
多端侧硬件全适配
PC(Win/macOS/Linux)、AIPC(NPU加速)、树莓派、工控边缘机、小主机NAS全支持;AMD Ryzen NPU/Intel Ultra NPU原生优化调度算力。

二、三层端侧架构(网关-模型-执行)

1. 接入网关层(通讯入口)

后台常驻服务(默认18789端口),无头无GUI,对接Telegram/飞书/Discord/iMessage等20+聊天软件;手机发消息远程操控本地电脑,跨设备端侧联动。

举例:微信发指令「整理桌面所有Excel并汇总」,远端PC端侧OpenClaw自动执行。

2. 模型对接层(端侧推理绑定)

兼容两种模型接入:

端侧本地首选:Ollama/LMStudio本地推理(本机GPU/NPU跑量化大模型,零token费用、离线),配置直接指向localhost:11434本地地址
备选:云端API(GPT/Claude),但违背端侧设计初衷

显存适配选型(端侧硬件参考)

本机显存
推荐本地量化模型
6G
Llama3.2-3B
12G
Llama3.2-8B
16G
Qwen3-8B量化
24G+
12B/34B大参数量化版

3. 端侧执行层(核心能力,端侧落地关键)

三大本地权限能力(全部本机运算):

系统操作
:读写本地文件、执行Shell/Python脚本、创建文件夹、批量重命名
软件自动化
:操控浏览器爬虫、填表、启动关闭桌面软件
自定义技能ClawHub
:社区上万插件,自动收发邮件、日历管理、本地文档解析、IoT设备控制

三、端侧三大核心优势(对比云端AI)

隐私拉满
:所有对话、文件数据全在本机,无第三方抓取,企业/个人涉密场景首选
超低延迟
:本地NPU/GPU推理+本机进程调用,响应50~200ms,远低于云端网络延迟
零使用成本
:一次部署硬件,无API计费,靠端侧算力无限调用大模型

四、三种部署模式(端侧/边缘/云端)

纯端侧单机(最常用)
:个人笔记本/AIPC本地部署,日常办公自动化、本地私人AI管家
边缘节点部署
:工厂工控、园区边缘服务器,多设备集群HA部署(搭配你之前问的HA高可用),批量设备自动化巡检
云端部署(备选)
:云服务器托管,不属于端侧范畴

五、OpenClaw和普通端侧大模型区别

原生端侧大模型(如Qwen端侧版)
:只做对话推理、文本生成,没有操作系统操作权限
OpenClaw
端侧调度框架,承接本地模型输出的指令,落地成电脑真实操作,AI从“只会说话”变成“本机执行者”

六、最简端侧部署链路

手机微信/Telegram发指令 → 本机OpenClaw服务 → 本机Ollama(NPU/GPU端侧推理) → AI拆解任务 → OpenClaw本地执行文件/脚本