Ollama模型怎么下载、更新、删除?

很多人不知道的是，现在跑一个大模型，本地电脑上，一条命令就够了。

ollama run qwen3.5:7b

回车。等十几秒。一个完全离线的AI助手就在你电脑里跑起来了。

没有API Key。没有配额限制。没有隐私顾虑。

这就是Ollama。它不是今年才出现，但它今年彻底破圈了。

一条命令背后的逻辑

Ollama做的事情看起来很简单：把大模型跑在本地。

但这条简单命令背后，其实解决了一个大问题：门槛。

过去想在本地跑模型，你需要懂CUDA、懂GPU配置、懂命令行参数、懂模型格式转换。光是环境配置就能劝退90%的人。

Ollama把这些全部封装了。

它自带模型市场。你想跑哪个模型，它帮你下载。它帮你管理版本。它处理好了所有依赖。你要做的，就是记住一条命令。

这就是为什么Ollama的用户增长曲线今年突然陡峭起来——不是因为技术突然变强了，而是因为门槛突然变低了。

下载、更新、删除，其实就三件事

很多新手第一次用Ollama，最懵的不是跑模型，而是：模型下到哪里了？怎么更新？怎么删？

其实很简单。

下载模型

最直接的方式：

ollama run 模型名

比如：

ollama run llama3.2ollama run qwen3.5:7bollama run deepseek-r1:8b

第一次运行会自动下载。下载完成的模型会保存在本地，之后再运行就是秒启。

如果你想看当前有哪些可用模型：

ollama list

更新模型

模型厂商更新了权重，想用新版本怎么办？

ollama pull 模型名

比如更新qwen2.5：

ollama pull qwen3.5:7b

这会下载最新版本，覆盖旧版本。

有一点需要知道：pull命令会重新下载整个模型。如果网络不稳定，可能需要一些时间。可以挂着让它自己跑。

删除模型

不想要的模型，占用硬盘空间，删掉：

ollama delete 模型名

比如删除llama3.2：

ollama delete llama3.2

查看本地模型及占用空间：

ollama list

列表里会显示每个模型的大小。7B模型通常7-8GB，14B的大概14-16GB。如果硬盘紧张，删掉不用的模型能腾出不少空间。

真正重要的不是命令

如果只看到命令，这一篇文章就白写了。

Ollama代表的趋势，比工具本身更重要。

本地大模型正在进入爆发期。

这个判断基于三个信号：

第一，模型越来越小，效果越来越好。两年前的7B模型，能力大概相当于现在的1.5B甚至更小。换句话说，今天一台普通笔记本能跑出两年前顶级GPU才能跑出的效果。

第二，隐私意识在觉醒。越来越多人不希望自己的对话被上传到第三方服务器。本地模型完全离线，数据不出本机，这个特性对很多人来说是刚需。

第三，成本结构在变。API调用是持续收费的。本地跑模型，一次性硬件投入，后期几乎零成本。对于高频使用者，这个账算得过来。

开源正在改变游戏规则

Ollama支持的所有模型，都是开源的。

Llama、Qwen、DeepSeek、Gemma……这些模型哪家最强，圈子里各有看法。但有一个共识：开源模型正在快速缩小与闭源模型的差距。

三年前，GPT-4横空出世，领先幅度是碾压级的。

今天，Qwen2.5、DeepSeek-R1、Llama3.2这些开源模型，在很多任务上已经能打了。

这个趋势不会停。

开源社区的迭代速度比任何人预想的都快。一个新架构、新想法，从论文发布到开源实现，往往只需要几周。闭源模型公司如果不能持续拉开差距，商业压力会越来越大。

而对用户来说，这是好事。

竞争越充分，门槛越低，选择越多。

不是替代，是分工

有人问我：本地模型能不能替代ChatGPT？

我的看法是：不是替代，是分工。

本地模型适合：需要隐私保护的场景、高频调用的固定任务、离线环境、极客式折腾。

云端模型适合：复杂推理、多模态、偶尔需要最强能力、不想折腾硬件。

两者会长期并存。

就像有人买书来看，有人用电子书。有人自己做饭，有人点外卖。需求不同，选择不同。

最后说一件事

如果你还没试过Ollama，找个晚上花十分钟装一下。

然后跑一下这条命令：

ollama run deepseek-r1:8b

跑完之后你会有一个感受：大模型离你真的很近，近到就在你电脑里。

这件事本身，就挺有意思的。