你还在为 AI 编程助手的 API 费用发愁吗?
你是否担心将公司代码发送到云端 AI 服务会有隐私风险?
今天介绍一个本地运行大语言模型的利器——Ollama。只需一条命令,就能在你的 Mac 上运行 Llama、Qwen、DeepSeek等主流大模型。无需联网、零 API 费用、数据永不离开本地,让 AI真正成为你的私有代码助手。无论你是想提升开发效率,还是想深入了解大模型技术,这篇指南都能帮你快速上手。
1. 什么是 Ollama
Ollama 是一个开源的本地大语言模型运行工具,让你能够在本地电脑上轻松运行和部署大型语言模型(LLM),无需依赖云服务。
2. 为什么选择 Ollama
- 隐私保护:数据不离开本地,代码和敏感信息安全
- 无网络依赖:离线可用,不受网络限制
- 零成本:无 API 费用,无限次调用
- 低延迟:本地运行,响应更快
- 模型丰富:支持 Llama、Qwen、DeepSeek、Mistral 等主流模型
- 简单易用:一行命令即可完成模型下载和运行
3. 适用场景
本地代码开发辅助 代码审查和重构 文档撰写 数据分析 学习和研究大模型
4. Mac 安装方法
方法一:官网下载(推荐)
访问官网:https://ollama.com/download 下载 macOS 版本 打开 dmg 文件,将 Ollama 拖入 Applications 运行 Ollama,终端会自动配置好 ollama命令
方法二:Homebrew 安装
bash复制代码
brew install ollama验证安装
bash复制代码
ollama --version5. 基本命令
bash复制代码
# 启动服务ollama serve# 查看已安装模型ollama list# 下载模型ollama pull <model_name># 运行模型对话ollama run <model_name># 查看运行中的模型ollama ps# 删除模型ollama rm <model_name>6. 停止运行中的模型
方法一:使用 stop 命令
bash复制代码
# 查看运行中的模型ollama ps# 停止指定模型ollama stop qwen2.5-coder:32b# 停止所有运行中的模型ollama stop方法二:设置自动卸载时间
bash复制代码
# 模型在 5 分钟无活动后自动卸载ollama run qwen2.5-coder:32b --keep-alive 5m# 立即卸载(0 表示立即)ollama run qwen2.5-coder:32b --keep-alive 0方法三:在交互会话中退出
bash复制代码
# 在 ollama run 会话中/bye# 或使用快捷键Ctrl+D方法四:停止 Ollama 服务
bash复制代码
# macOS - 停止后台服务launchctl bootout system/com.ollama.ollama# 或直接终止进程pkill ollama# Linuxsystemctl stop ollama验证模型已卸载
bash复制代码
# 查看运行中的模型(应无输出)ollama pskeep-alive 参数说明
0 | |
5m | |
10m | |
24h | |
-1 |
7. 热门模型列表
llama3.1 | ||
llama3.2 | ||
llama3.3 | ||
deepseek-r1 | ||
deepseek-v3 | ||
qwen3 | ||
qwen3.5 | ||
qwen2.5 | ||
qwen2.5-coder | ||
mistral | ||
mistral-nemo | ||
gemma3 | ||
gemma4 | ||
phi3 | ||
phi4 | ||
codellama | ||
llava | ||
nomic-embed-text | ||
bge-m3 |
8. 代码开发推荐模型
小型项目
qwen2.5-coder:7b | ||
deepseek-r1:7b | ||
codellama:7b |
大型项目
qwen2.5-coder:32b | ||
deepseek-r1:32b | ||
deepseek-coder-v2 | ||
qwen2.5-coder:14b |
参数规模选择
MacBook M1/M2: 7B (约需 8GB 内存) 性能更好: 14B 或 32B 轻量快速: 3B 或 1.5B
夜雨聆风