OpenClaw(龙虾)端侧AI智能体框架探索研究总结

OpenClaw（龙虾）｜端侧AI智能体框架

OpenClaw：开源本地优先端侧AI Agent网关，不内置大模型，把本地端侧大模型（Ollama/LMStudio）和系统、聊天软件打通，让AI在本机读文件、跑脚本、操控电脑、自动干活，纯端侧离线运行。

MIT开源、TS开发、外号小龙虾，2025年底开源，主打端侧私有化+AI工具执行，是当下端侧智能体标杆。

一、核心定位（端侧属性）

Local-First本地优先 = 纯正端侧架构

全部会话、记忆、任务日志存在本机硬盘（Markdown/JSON），数据不出设备、不上第三方云端；可完全断网离线使用本地大模型（Llama3、Qwen、Mistral量化版）。

角色：AI手脚调度中枢

本身不是推理引擎，对接端侧推理（Ollama/NCNN/ONNX）+ 操作系统接口：

大脑：本地端侧大模型（本机NPU/GPU跑）

手脚：OpenClaw接管Shell、文件、浏览器、软件调用、API自动化

多端侧硬件全适配

PC(Win/macOS/Linux)、AIPC(NPU加速)、树莓派、工控边缘机、小主机NAS全支持；AMD Ryzen NPU/Intel Ultra NPU原生优化调度算力。

二、三层端侧架构（网关-模型-执行）

1. 接入网关层（通讯入口）

后台常驻服务（默认18789端口），无头无GUI，对接Telegram/飞书/Discord/iMessage等20+聊天软件；手机发消息远程操控本地电脑，跨设备端侧联动。

举例：微信发指令「整理桌面所有Excel并汇总」，远端PC端侧OpenClaw自动执行。

2. 模型对接层（端侧推理绑定）

兼容两种模型接入：

✅端侧本地首选：Ollama/LMStudio本地推理（本机GPU/NPU跑量化大模型，零token费用、离线），配置直接指向localhost:11434本地地址

备选：云端API（GPT/Claude），但违背端侧设计初衷

显存适配选型（端侧硬件参考）

本机显存	推荐本地量化模型
6G	Llama3.2-3B
12G	Llama3.2-8B
16G	Qwen3-8B量化
24G+	12B/34B大参数量化版

3. 端侧执行层（核心能力，端侧落地关键）

三大本地权限能力（全部本机运算）：

系统操作

：读写本地文件、执行Shell/Python脚本、创建文件夹、批量重命名

软件自动化

：操控浏览器爬虫、填表、启动关闭桌面软件

自定义技能ClawHub

：社区上万插件，自动收发邮件、日历管理、本地文档解析、IoT设备控制

三、端侧三大核心优势（对比云端AI）

隐私拉满

：所有对话、文件数据全在本机，无第三方抓取，企业/个人涉密场景首选

超低延迟

：本地NPU/GPU推理+本机进程调用，响应50~200ms，远低于云端网络延迟

零使用成本

：一次部署硬件，无API计费，靠端侧算力无限调用大模型

四、三种部署模式（端侧/边缘/云端）

纯端侧单机（最常用）

：个人笔记本/AIPC本地部署，日常办公自动化、本地私人AI管家

边缘节点部署

：工厂工控、园区边缘服务器，多设备集群HA部署（搭配你之前问的HA高可用），批量设备自动化巡检

云端部署（备选）

：云服务器托管，不属于端侧范畴

五、OpenClaw和普通端侧大模型区别

原生端侧大模型（如Qwen端侧版）

：只做对话推理、文本生成，没有操作系统操作权限

OpenClaw

：端侧调度框架，承接本地模型输出的指令，落地成电脑真实操作，AI从“只会说话”变成“本机执行者”

六、最简端侧部署链路

手机微信/Telegram发指令 → 本机OpenClaw服务 → 本机Ollama(NPU/GPU端侧推理) → AI拆解任务 → OpenClaw本地执行文件/脚本