乐于分享
好东西不私藏

本地大模型微调 + 部署完整实操文档 + 建立企业私有模型(企业私有AI模型方案)

本地大模型微调 + 部署完整实操文档 + 建立企业私有模型(企业私有AI模型方案)

本地大模型微调 + 部署完整实操文档(LLaMA-Factory + DeepSeek-R1-Distill-Qwen-1.5B + Ollama

第一步:环境准备(Win11 + Anaconda

1安装Anaconda,用于管理 Python 虚拟环境。

https://www.anaconda.com/download/success

2(可选)本地安装 CUDA ToolkitcuDNNGPU 加速训练;也可直接使用 PyTorch 内置 CUDA 运行时。

https://developer.nvidia.com/cuda-downloads

https://developer.nvidia.com/cudnn-downloads

克隆 / 下载 LLaMA-Factory 源码

https://github.com/hiyouga/LLaMA-Factory.git

国内镜像(下载更快):https://gitcode.com/hua767/LLaMA-Factory

下载后在中启动anaconda 安装power shell prompt,并打开

powershell prompt 下依次运行下面的脚本安装环境需要的依赖

退出当前环境

conda deactivate

删除损坏环境

conda remove -n LLama-fact –all

新建纯净环境 python3.11LLaMA-Factory官方推荐)

conda create -n LLama-fact python=3.11

conda activate LLama-fact

安装 PyTorch(适配 RTX50 系列显卡)

pip install –pre torch torchvision torchaudio –index-url https://download.pytorch.org/whl/nightly/cu128

#安装 LLaMA-Factory 全套依赖库

pip install accelerate==1.11.0 datasets==3.2.0 gradio==5.50.0 peft==0.18.1 transformers==4.56.2 fsspec==2024.3.1 trl==0.24.0 sentencepiece tiktoken -i https://pypi.tuna.tsinghua.edu.cn/simple

安装llamafactory本体,在克隆的LLaMA-Factory目录下运行

pip install -e .

启动

$env:DATASETS_DISABLE_FINGERPRINT=”1″

llamafactory-cli webui

出现下面的界面就成功了。

第二步:下载基础大模型 DeepSeek-R1-Distill-Qwen-1.5B

修改大模型存放位置:$env:HF_HOME = “D:\AI\Hugging-Face”

修改大模型下载位置:$env:HF_ENDPOINT=” https://hf-mirror.com “

安装huggingface_hubpip install -U huggingface_hub

执行模型下载:

huggingface-cli download –resume-download deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

hf downloaddeepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

打开训练页面:设置模型和模型地址如下:

第三步:准备微调数据集 (这一步是微调的主要目的)

进入 LLaMA-Factory/data 目录,参考目录内identity.json 格式,新建自定义数据集文件(示例:MaintisAI.json)。(数据量太少会导致训练效果不好,尽量自己多生成一些):

注册数据集(修改 dataset_info.json):把MantisAI.json配置到dataset_info.json文件里

第四步:启动 WebUI 并执行模型微调

规避数据集序列化报错

$env:DATASETS_DISABLE_FINGERPRINT=”1″

启动LLaMA-Factory可视化界面

llamafactory-cli webui

启动成功后,浏览器自动访问 http://localhost:7860

训练页面修改模型微调数据地址:

模型名称:选择 DeepSeek-R1-1.5B-Distill-Qwen

模型路径:填写模型快照完整路径D:\AI\Hugging-Face\hub\models–deepseek-ai–DeepSeek-R1-Distill-Qwen-1.5B\snapshots\哈希文件夹

微调方法:lora

量化方法:bnb

对话模板:deepseekr1

加速方式:noneDeepSpeed 保持关闭,单卡无需使用)

训练阶段:Supervised Fine-Tuning

数据路径:LLaMA-Factory/data

数据集:选择刚刚注册的 MaintisAI

(参数很多,不太懂,自己慢慢研究)

设置好后,下拉页面,点开始训练。等待训练完毕。

第五步:模型效果测试(Chat 对话验证)

点击【Chat】检验我们的训练效果,在检查点路径选择我们刚刚训练的模型。(检查点路径” 是指 模型训练过程中的中间保存文件的位置,通常用于 恢复训练 或 加载已经训练好的模型。)点击【加载模型】,就可以开始聊天了:

第六步导出大模型

点导出Export

微调方法:lora

检查点路径:选择训练产出的检查点

导出设备:cpu

导出目录:自定义路径(示例:D:\AI\mymodel

设置好后点开始导出,可以看到模型已经导出到指定的目录。

第七步:Ollama 部署运行微调后模型

1.迁移模型文件

将导出的整个模型文件夹,复制到 Ollama 模型目录 下。

2. 执行模型导入

打开终端,进入 Ollama 目录,执行创建命令(注意路径分隔):

运行

ollama create mymodel -f D:\Ollama\models\mymodel\Modelfile

ollama run mymodel

测试模型运行成功