本地大模型微调 + 部署完整实操文档 + 建立企业私有模型(企业私有AI模型方案)-夜雨聆风

本地大模型微调 + 部署完整实操文档 + 建立企业私有模型(企业私有AI模型方案)

本地大模型微调 + 部署完整实操文档（LLaMA-Factory + DeepSeek-R1-Distill-Qwen-1.5B + Ollama）

第一步：环境准备（Win11 + Anaconda）

1安装Anaconda，用于管理 Python 虚拟环境。

https://www.anaconda.com/download/success

2（可选）本地安装 CUDA Toolkit、cuDNN，GPU 加速训练；也可直接使用 PyTorch 内置 CUDA 运行时。

https://developer.nvidia.com/cuda-downloads

https://developer.nvidia.com/cudnn-downloads

3 克隆 / 下载 LLaMA-Factory 源码

https://github.com/hiyouga/LLaMA-Factory.git

国内镜像（下载更快）：https://gitcode.com/hua767/LLaMA-Factory

下载后在中启动anaconda 安装power shell prompt，并打开

在powershell prompt 下依次运行下面的脚本安装环境需要的依赖

# 退出当前环境

conda deactivate

# 删除损坏环境

conda remove -n LLama-fact –all

# 新建纯净环境 python3.11（LLaMA-Factory官方推荐）

conda create -n LLama-fact python=3.11

conda activate LLama-fact

# 安装 PyTorch（适配 RTX50 系列显卡）

pip install –pre torch torchvision torchaudio –index-url https://download.pytorch.org/whl/nightly/cu128

#安装 LLaMA-Factory 全套依赖库

pip install accelerate==1.11.0 datasets==3.2.0 gradio==5.50.0 peft==0.18.1 transformers==4.56.2 fsspec==2024.3.1 trl==0.24.0 sentencepiece tiktoken -i https://pypi.tuna.tsinghua.edu.cn/simple

# 安装llamafactory本体,在克隆的LLaMA-Factory目录下运行

pip install -e .

# 启动

$env:DATASETS_DISABLE_FINGERPRINT=”1″

llamafactory-cli webui

出现下面的界面就成功了。

第二步：下载基础大模型 DeepSeek-R1-Distill-Qwen-1.5B。

修改大模型存放位置：$env:HF_HOME = “D:\AI\Hugging-Face”

修改大模型下载位置：$env:HF_ENDPOINT=” https://hf-mirror.com “

安装huggingface_hub：pip install -U huggingface_hub

执行模型下载：

huggingface-cli download –resume-download deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

或

hf downloaddeepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

打开训练页面：设置模型和模型地址如下：

第三步：准备微调数据集（这一步是微调的主要目的）

进入 LLaMA-Factory/data 目录，参考目录内identity.json 格式，新建自定义数据集文件（示例：MaintisAI.json）。（数据量太少会导致训练效果不好，尽量自己多生成一些）：

注册数据集（修改 dataset_info.json）：把MantisAI.json配置到dataset_info.json文件里

第四步：启动 WebUI 并执行模型微调

# 规避数据集序列化报错

$env:DATASETS_DISABLE_FINGERPRINT=”1″

# 启动LLaMA-Factory可视化界面

llamafactory-cli webui

启动成功后，浏览器自动访问 http://localhost:7860

训练页面修改模型微调数据地址：

模型名称：选择 DeepSeek-R1-1.5B-Distill-Qwen

模型路径：填写模型快照完整路径D:\AI\Hugging-Face\hub\models–deepseek-ai–DeepSeek-R1-Distill-Qwen-1.5B\snapshots\哈希文件夹

微调方法：lora

量化方法：bnb

对话模板：deepseekr1

加速方式：none（DeepSpeed 保持关闭，单卡无需使用）

训练阶段：Supervised Fine-Tuning

数据路径：LLaMA-Factory/data

数据集：选择刚刚注册的 MaintisAI

（参数很多，不太懂，自己慢慢研究）

设置好后，下拉页面，点开始训练。等待训练完毕。

第五步：模型效果测试（Chat 对话验证）

点击【Chat】检验我们的训练效果，在检查点路径选择我们刚刚训练的模型。（检查点路径” 是指模型训练过程中的中间保存文件的位置，通常用于恢复训练或加载已经训练好的模型。）点击【加载模型】，就可以开始聊天了：

第六步. 导出大模型

点导出Export，

微调方法：lora

检查点路径：选择训练产出的检查点

导出设备：cpu

导出目录：自定义路径（示例：D:\AI\mymodel）

设置好后点开始导出，可以看到模型已经导出到指定的目录。

第七步：Ollama 部署运行微调后模型

1.迁移模型文件

将导出的整个模型文件夹，复制到 Ollama 模型目录下。

2. 执行模型导入

打开终端，进入 Ollama 目录，执行创建命令（注意路径分隔）：

运行

ollama create mymodel -f D:\Ollama\models\mymodel\Modelfile

ollama run mymodel

测试模型运行成功