零成本养"虾":OpenClaw本地部署完整教程
零成本养”虾”:OpenClaw本地部署完整教程
OpenClaw这玩意儿最近是真火。但很多人一听说要部署,第一反应就是——得花钱买服务器,还得折腾一堆配置。
其实不然。今天就跟大家分享怎么在普通电脑上零成本把OpenClaw跑起来,而且用的是免费的开源模型,连API费用都省了。
零成本的核心:Ollama
先说说为什么能零成本。OpenClaw本身是开源的,不要钱。但它调用大模型的时候,如果接的是GPT或者Claude的API,每次对话都会产生费用。用得多了,账单也挺肉疼的。
解决方案是用Ollama在本地跑开源模型。Ollama是一个可以让你在本地运行大模型的工具,完全免费,离线也能用,数据不离开你的电脑,隐私方面也放心。
对新手来说,我推荐用Qwen2.5(通义千问)的7B版本。这个模型中文能力很强,参数量够用,而且对硬件要求不算太高。
第一步:安装Ollama
Ollama的安装非常简单。去官网下载对应你操作系统的版本,Windows就下Windows版,双击安装就行。Mac和Linux也有对应的安装方式。
装完之后打开终端或者命令行,输入”ollama –version”看看版本号,能显示就说明安装成功了。
然后下载模型。在终端里输一行命令就行:
ollama pull qwen2.5:7b
根据你的网速不同,下载大概需要十到三十分钟。模型文件大约4.7GB,耐心等一会儿。
下载完了之后,Ollama默认会在本地11434端口启动一个服务,这个后面配置OpenClaw的时候要用。
第二步:安装OpenClaw
OpenClaw需要Node.js 22以上的版本。先确认一下你的电脑有没有装Node.js,打开终端输入”node -v”看看版本号。
如果版本不够或者没装,去Node.js官网下载最新版安装就行。
装好Node.js之后,在终端里运行:
npm install -g openclaw
等它安装完成。然后运行”openclaw start”启动引导向导,它会让你选择用什么大模型、配置API密钥之类的。
这里要注意:我们不接云端的API,所以后面要把模型提供方改成Ollama。
第三步:配置OpenClaw连接Ollama
有两种方式可以配置。
第一种是通过控制台。打开浏览器访问localhost:3000,进入OpenClaw的控制台。找到设置里的模型配置,添加一个新模型。名称可以写”Ollama Qwen”,类型选Ollama,地址填http://localhost:11434,模型名填qwen2.5:7b。保存就行了。
第二种是直接改配置文件。找到OpenClaw的配置文件(一般在~/.openclaw/.env),在里面加上Ollama的相关配置。
配置完之后,你就可以跟本地跑的大模型对话了,而且完全免费,不用花一分钱。
第四步:优化性能
如果你的电脑有NVIDIA显卡,装好CUDA之后,Ollama会自动使用GPU加速,推理速度会快很多。可以用nvidia-smi命令查看Ollama进程是否在用GPU。
如果内存不够,可以试试量化版本。下载命令变成”ollama pull qwen2.5:7b-q4_0″,这个版本更小,对内存要求更低。
响应速度慢的话,可以调小上下文窗口。在运行模型的时候加个参数:ollama run qwen2.5:7b –num-ctx 2048,这样就只使用2048的上下文长度,速度会快不少。
第五步:玩转多模型切换
Ollama的一个好处是你可以同时下载多个模型,然后按需切换。
比如你可以下载三个模型:qwen2.5:3b(轻量版,日常对话用)、qwen2.5:7b(标准版,复杂任务用)、codellama:7b(写代码用)。然后在OpenClaw的配置文件里把它们都配好。
日常聊天就用轻量版,响应速度快。碰到复杂问题切到标准版。写代码的时候换到代码专用模型。
不同配置跑什么模型
根据你的电脑配置,我整理了一个参考:
8G内存没显卡——跑qwen2.5:3b的量化版就行。
16G内存没显卡——可以跑qwen2.5:7b标准版。
16G内存加RTX 3060——可以跑qwen2.5:14b,效果更好。
32G内存加RTX 4090——想跑啥跑啥,32B的模型都能试试。
一些实际体验
我自己是在一台16G内存、没独立显卡的老笔记本上跑的。用qwen2.5:7b,日常聊天、写简单的文案、查资料,完全够用。响应速度大概几秒到十几秒,比云端API肯定慢一些,但胜在免费。
最爽的一点是,没有调用次数的限制。云端API一般都有每分钟请求次数限制,本地部署想怎么聊就怎么聊。
另一个好处是离线能用。有次出差在高铁上,没网,打开电脑照样能用OpenClaw帮我改文档。这种体验是云端方案给不了的。
总结
OpenClaw加Ollama这套组合,可以说是目前实现”免费AI助手”的最佳方案。零成本、隐私安全、离线可用,而且配置起来也不复杂。
如果你的电脑配置还凑合,强烈建议试试。先把Ollama装好拉个模型下来,再装上OpenClaw配好连接,前后用不了半小时。一旦跑通了,你就相当于有了一个永远不花钱、24小时在线的私人AI助手。
出品 | 鹏冲AI成长Copilot
夜雨聆风