需要在本地训练/部署大模型吗?这个开源工具让训练速度翻倍,显存减少70%-夜雨聆风

需要在本地训练/部署大模型吗?这个开源工具让训练速度翻倍,显存减少70%

你有没有尝试过：想微调一个大模型，结果发现：

不是你太穷，也不是模型太难，而是你没用对工具。

今天要介绍的 Unsloth，就是为解决这个问题而生。

它让LLM训练变得更快、更省显存的开源工具包，让训练大模型变得像在本地跑个小项目一样简单。目前已经55K+的star。

一、它直面大模型微调的三个痛点

当前微调大模型的痛点太明显：

Unsloth 说：我可以用更少的显存，跑得更快，还能保持精度。

Unsloth部署好后，页面长这样：

下面是摘自项目Github主页的战绩：

用Qwen3.5-4B模型，训练速度提升1.5倍，显存减少60%；

用gpt-oss-20B，训练速度提升2倍，显存减少70%；

用Llama3.1-8B，训练速度提升2倍，显存减少70%；

二、为什么这么厉害？

Unsloth 的核心是优化了训练过程中的计算和内存使用，主要是下面3个关键点：

1. Triton内核优化

2. 动态2.0量化

3. 无近似训练

去试试吧，看看到底有没有吹牛皮。

🌐 项目地址：https://github.com/unslothai/unsloth

📚 官方文档：https://unsloth.ai/docs

请在微信客户端打开

需要在本地训练/部署大模型吗?这个开源工具让训练速度翻倍,显存减少70%