显存占用减少70%,这个工具让每个人都能训练大模型
大家好,我是何三,独立开发者。
今天要给大家介绍一个超级好用的 AI 模型训练工具——Unsloth。如果你想在本地训练大模型,但又觉得配置复杂、硬件要求高,那这篇文章绝对适合你。
为什么需要 Unsloth?
在 AI 领域,训练大模型一直是个技术活。传统的训练方式不仅需要昂贵的 GPU 资源,还要处理各种复杂的配置文件、依赖包,光是环境搭建就能劝退不少人。而且,训练过程中还要担心显存不够用、训练速度慢等问题。
Unsloth 就是为了解决这些痛点而生的。它提供了一个统一的本地界面,让你可以轻松地运行和训练各种开源大模型,比如 Qwen、DeepSeek、GPT-OSS、Gemma 等。最关键的是,它能让训练速度提升 2 倍,显存占用减少 70%,而且精度完全不受影响。

Unsloth 的核心功能
Unsloth 主要分为两个版本:Unsloth Studio(网页版)和 Unsloth Core(代码版)。对于大多数用户来说,Unsloth Studio 更容易上手。
推理功能
推理就是让模型”思考”并生成答案。Unsloth 的推理功能非常强大:
- 模型管理:可以直接搜索、下载并运行各种格式的模型,包括 GGUF、LoRA adapters、safetensors 等
- 模型导出:可以将训练好的模型导出为 GGUF、16-bit safetensors 等格式
- 工具调用:支持自我修复的工具调用和网页搜索功能
- 代码执行:让 LLM 能够运行代码、处理数据并验证结果,这样答案会更准确
- 多模态支持:可以上传图片、音频、PDF、代码、DOCX 等多种文件类型进行对话
训练功能
训练是 Unsloth 的核心优势:
- 高效训练:支持 500+ 种模型,训练速度提升 2 倍,显存占用减少 70%
- 多种训练方式:支持全量微调、预训练、4-bit、16-bit 和 FP8 训练
- 实时监控:可以实时监控训练过程,跟踪损失和 GPU 使用情况,还能自定义图表
- 数据处理:可以从 PDF、CSV、DOCX 等文件自动创建数据集,还能通过可视化的节点工作流编辑数据
- 强化学习:提供最高效的强化学习库,GRPO、FP8 等功能可以节省 80% 的显存
- 多 GPU 支持:目前已经支持多 GPU 训练,未来还会有重大升级

快速上手
安装 Unsloth Studio 非常简单,支持 Windows、Linux、WSL 和 macOS。
Windows 安装
在 PowerShell 中运行:
irm https://raw.githubusercontent.com/unslothai/unsloth/main/install.ps1 | iex
安装完成后,启动:
& .\unsloth_studio\Scripts\unsloth.exe studio -H 0.0.0.0 -p 8888
Linux/macOS 安装
在终端中运行:
curl -fsSL https://raw.githubusercontent.com/unslothai/unsloth/main/install.sh | sh
启动:
source unsloth_studio/bin/activateunsloth studio -H 0.0.0.0 -p 8888
安装完成后,打开浏览器访问 http://localhost:8888 就能看到 Unsloth Studio 的界面了。
实战演示

让我们用一个简单的例子来演示如何使用 Unsloth 训练一个模型。
假设我们想训练一个专门写 Python 代码的模型,可以按照以下步骤操作:
- 准备数据集:创建一个 JSON 文件,包含问题和对应的代码答案
[ { "instruction": "写一个 Python 函数计算斐波那契数列", "output": "def fibonacci(n):\n if n <= 1:\n return n\n return fibonacci(n-1) + fibonacci(n-2)" }, { "instruction": "写一个 Python 函数判断一个数是否为质数", "output": "def is_prime(n):\n if n < 2:\n return False\n for i in range(2, int(n**0.5) + 1):\n if n % i == 0:\n return False\n return True" }]
-
在 Unsloth Studio 中导入数据集:通过界面导入 JSON 文件
-
选择基础模型:比如选择 Qwen2.5-7B-Instruct
-
配置训练参数:
- 学习率:2e-4
- Batch size:4
- 训练轮数:3
- LoRA rank:16
-
开始训练:点击开始训练,Unsloth 会自动处理剩下的工作
-
导出模型:训练完成后,可以导出为 GGUF 格式,方便部署
硬件要求
Unsloth 对硬件的要求相对友好:
- CPU:支持聊天推理
- NVIDIA GPU:RTX 30/40/50 系列、Blackwell、DGX Spark、Station 等都支持训练
- macOS:目前支持聊天,MLX 训练功能即将推出
- AMD GPU:聊天功能可用,训练需要使用 Unsloth Core
总结
Unsloth 是一个非常适合个人开发者和中小团队的 AI 模型训练工具。它的优势在于:
- 简单易用:统一的网页界面,无需复杂的命令行操作
- 高效训练:训练速度快,显存占用低
- 功能全面:支持推理、训练、数据处理、强化学习等完整流程
- 跨平台支持:Windows、Linux、macOS 都能用
- 免费使用:提供免费的 notebook,可以在线训练模型
如果你想在本地训练自己的大模型,Unsloth 绝对是一个值得尝试的工具。无论是做垂直领域的微调,还是学习 AI 模型训练技术,它都能帮你节省大量时间和精力。
夜雨聆风