乐于分享
好东西不私藏

Ollama模型怎么下载、更新、删除?

Ollama模型怎么下载、更新、删除?

很多人不知道的是,现在跑一个大模型,本地电脑上,一条命令就够了。
ollama run qwen3.5:7b
回车。等十几秒。一个完全离线的AI助手就在你电脑里跑起来了。
没有API Key。没有配额限制。没有隐私顾虑。
这就是Ollama。它不是今年才出现,但它今年彻底破圈了。

一条命令背后的逻辑

Ollama做的事情看起来很简单:把大模型跑在本地
但这条简单命令背后,其实解决了一个大问题:门槛
过去想在本地跑模型,你需要懂CUDA、懂GPU配置、懂命令行参数、懂模型格式转换。光是环境配置就能劝退90%的人。
Ollama把这些全部封装了。
它自带模型市场。你想跑哪个模型,它帮你下载。它帮你管理版本。它处理好了所有依赖。你要做的,就是记住一条命令。
这就是为什么Ollama的用户增长曲线今年突然陡峭起来——不是因为技术突然变强了,而是因为门槛突然变低了。

下载、更新、删除,其实就三件事

很多新手第一次用Ollama,最懵的不是跑模型,而是:模型下到哪里了?怎么更新?怎么删?
其实很简单。

下载模型

最直接的方式:
ollama run 模型名
比如:
ollama run llama3.2ollama run qwen3.5:7bollama run deepseek-r1:8b
第一次运行会自动下载。下载完成的模型会保存在本地,之后再运行就是秒启。
如果你想看当前有哪些可用模型:
ollama list

更新模型

模型厂商更新了权重,想用新版本怎么办?
ollama pull 模型名
比如更新qwen2.5:
ollama pull qwen3.5:7b
这会下载最新版本,覆盖旧版本。
有一点需要知道:pull命令会重新下载整个模型。如果网络不稳定,可能需要一些时间。可以挂着让它自己跑。

删除模型

不想要的模型,占用硬盘空间,删掉:
ollama delete 模型名
比如删除llama3.2:
ollama delete llama3.2
查看本地模型及占用空间:
ollama list
列表里会显示每个模型的大小。7B模型通常7-8GB,14B的大概14-16GB。如果硬盘紧张,删掉不用的模型能腾出不少空间。

真正重要的不是命令

如果只看到命令,这一篇文章就白写了。
Ollama代表的趋势,比工具本身更重要。
本地大模型正在进入爆发期。
这个判断基于三个信号:
第一,模型越来越小,效果越来越好。两年前的7B模型,能力大概相当于现在的1.5B甚至更小。换句话说,今天一台普通笔记本能跑出两年前顶级GPU才能跑出的效果。
第二,隐私意识在觉醒。越来越多人不希望自己的对话被上传到第三方服务器。本地模型完全离线,数据不出本机,这个特性对很多人来说是刚需。
第三,成本结构在变。API调用是持续收费的。本地跑模型,一次性硬件投入,后期几乎零成本。对于高频使用者,这个账算得过来。

开源正在改变游戏规则

Ollama支持的所有模型,都是开源的。
Llama、Qwen、DeepSeek、Gemma……这些模型哪家最强,圈子里各有看法。但有一个共识:开源模型正在快速缩小与闭源模型的差距
三年前,GPT-4横空出世,领先幅度是碾压级的。
今天,Qwen2.5、DeepSeek-R1、Llama3.2这些开源模型,在很多任务上已经能打了。
这个趋势不会停。
开源社区的迭代速度比任何人预想的都快。一个新架构、新想法,从论文发布到开源实现,往往只需要几周。闭源模型公司如果不能持续拉开差距,商业压力会越来越大。
而对用户来说,这是好事。
竞争越充分,门槛越低,选择越多。

不是替代,是分工

有人问我:本地模型能不能替代ChatGPT?
我的看法是:不是替代,是分工
本地模型适合:需要隐私保护的场景、高频调用的固定任务、离线环境、极客式折腾。
云端模型适合:复杂推理、多模态、偶尔需要最强能力、不想折腾硬件。
两者会长期并存。
就像有人买书来看,有人用电子书。有人自己做饭,有人点外卖。需求不同,选择不同。

最后说一件事

如果你还没试过Ollama,找个晚上花十分钟装一下。
然后跑一下这条命令:
ollama run deepseek-r1:8b
跑完之后你会有一个感受:大模型离你真的很近,近到就在你电脑里。
这件事本身,就挺有意思的。