玩AI本地部署的朋友都知道一个痛点:云端Claude好用但收费限流,本地模型免费离线却缺少顶级交互体验。
要么花钱充值API额度,频繁受网络、限流、风控影响;要么跑本地开源模型,工具适配差、代码解析弱、智能度大打折扣。
今天给大家分享我亲测落地的终极解决方案:Claude Code + Ollama 本地无缝对接。
全程本地离线运行、零API费用、无网络风控,同时保留Claude顶级的代码调试、逻辑梳理、项目重构能力,搭配Ollama轻量化、高适配的本地模型生态,是目前个人AI工作流最稳的免费组合。
所有步骤均为Mac终端实操打磨,无冗余操作、无踩坑漏洞,新手也能一键复刻。
一、为什么一定要搭「Claude + Ollama」本地组合?
先讲清楚这套架构的核心优势,看懂就知道为什么它是技术玩家标配:
1. 彻底摆脱付费与限流
原生Claude API按次计费、额度昂贵,批量开发、高频调试成本极高,还会遭遇临时限流、账号风控问题。对接Ollama本地模型后,全程离线运行,永久免费,不限调用次数。
2. 兼顾极致体验与本地化安全
Claude Code的终端交互、代码补全、项目纠错、文件重构能力,吊打多数本地开源模型;而Ollama可以本地部署Qwen、DeepSeek等主流模型,数据不出本机,杜绝代码、项目资料泄露,适合私密项目开发。
3. 适配全场景开发工作流
无论是单文件代码修改、bug排查、脚本编写,还是整项目架构优化、批量文件重构,这套组合都能完美适配,响应速度远超云端弱网环境,本地秒级应答。
4. 兼容性拉满
支持所有Ollama适配模型(通义千问、DeepSeek、代码专用模型等),可随时切换模型参数,轻量化调试、高精度开发自由切换。
二、前置环境准备(极简两步)
本次配置基于 MacOS + Zsh 终端,所有指令通用、无需复杂环境配置,仅需提前装好两个核心工具:
1. 安装Ollama本地模型框架
直接终端执行官方一键安装指令:
curl -fsSL https://ollama.com/install.sh | sh
安装完成后,输入下述指令验证是否安装成功:
ollama --version
输出版本号即代表环境正常。
2. 安装Claude Code终端工具
通过npm一键安装全局Claude Code:
npm install -g claude-code
验证安装:
claude --version
小贴士:未安装Node的朋友,先通过Homebrew安装Node.js,再执行上述指令即可。
三、核心配置:Claude 对接本地 Ollama(关键步骤)
整套配置的核心,是通过环境变量劫持Claude默认API地址,让Claude不再请求云端官方接口,转而调用本地11434端口的Ollama服务。
第一步:拉取本地适配模型
优先推荐代码开发专用模型,稳定性、解析精度最优,终端执行:
# 拉取通义千问3.5代码模型(推荐)
ollama pull qwen3.5:27b
# 轻量化低配可选:qwen3:6b(低配设备适配)
ollama pull qwen3:6b
等待模型下载完成,输入 ollama list 即可查看已安装本地模型。
第二步:配置Claude全局对接参数
1. 创建Claude专属配置文件夹
mkdir -p ~/.claude
2. 新建并写入核心配置文件
nano ~/.claude/settings.json
3. 直接复制粘贴下述完整配置(已避坑,无需修改)
{
"env": {
"ANTHROPIC_BASE_URL": "http://localhost:11434",
"ANTHROPIC_AUTH_TOKEN": "ollama",
"ANTHROPIC_MODEL": "qwen3.5:27b"
}
}
• 核心参数解析:
• ANTHROPIC_BASE_URL:固定Ollama本地默认端口,禁止加/v1后缀(高频踩坑点)
• ANTHROPIC_AUTH_TOKEN:本地对接固定填写ollama即可
• ANTHROPIC_MODEL:填写你本地拉取的模型名称,可自由替换
粘贴完成后,按 Ctrl+O 保存、Ctrl+X 退出编辑。
第三步:全局环境变量永久生效
终端执行两行核心环境变量配置,永久生效无需重复设置:
export ANTHROPIC_AUTH_TOKEN=ollama
export ANTHROPIC_BASE_URL=http://localhost:11434
若需要永久全局生效,可写入zsh配置文件:
nano ~/.zshrc
将上述两行变量代码粘贴至文件末尾,保存后执行:
source ~/.zshrc
四、启动运行 & 功能验证
1. 启动本地AI交互
终端直接输入启动指令,指定本地模型运行Claude:
claude --model qwen3.5:27b
2. 实测验证是否对接成功
进入交互界面后,输入测试指令:
请告诉我你当前调用的模型、接口地址,以及运行环境
正常返回 本地Ollama模型信息 + 11434本地端口地址,即代表对接成功。
此时所有对话、代码操作、项目调试,均为本地离线运行,无任何网络请求、无费用消耗。
五、高频踩坑避坑总结(亲测有效)
整理配置过程中90%人会遇到的问题,一次性规避:
1. ❌ 错误写法:地址后缀加 /v1
http://localhost:11434/v1
✅ 正确写法:纯端口地址,无任何后缀
http://localhost:11434
2. ❌ 模型名称填写错误
必须和 ollama list 查询到的模型全名完全一致,大小写、参数后缀不能错
3. ❌ 环境变量临时失效
单次终端配置仅当前窗口生效,写入 .zshrc 才可永久全局复用
4. ❌ 端口占用报错
若11434端口被占用,可修改Ollama端口后同步更新配置文件地址
六、这套工作流的实际使用价值
深耕本地AI部署多年,真心觉得 Claude Code + Ollama 是个人开发者、独立创业者的最优解:
不用再为AI调用付费,告别云端卡顿、限流、隐私泄露风险;
用顶级的Claude交互体验,跑完全可控的本地开源模型;
无论是日常代码开发、脚本编写、bug修复,还是项目架构优化、文案创作、逻辑梳理,都能一站式搞定。
配置一次,永久复用,真正实现本地AI自由。
后续我会持续更新本地AI工作流优化技巧,包括模型轻量化调优、批量脚本自动化、多模型自由切换等实操教程,帮大家把本地AI工具的价值用到极致。
需要整套可直接复制的一键配置指令合集,可以留言自取!
夜雨聆风