LLaMa-Factory部署微调大模型教程

由此便成功实现了直观的交互式的大模型微调，通过选择不同的模型、微调模式、数据集，设置不同的训练参数进行微调，最终还可以导出微调后合并的模型。各种参数模式的设置大家加油探索吧！可以从huggingface或者魔塔社区下载大模型，下载成功后需记住保存的地址，后续微调需要使用，以Qwen2.5-1.5B为例下载好的文件目录如下。模型的地址就是刚才下载保存的地址，注意模型名称要和地址下的名称所对应，这里我

Donkey～

917人浏览 · 2025-08-04 16:22:01

Donkey～ · 2025-08-04 16:22:01 发布

LLaMa-Factory部署微调大模型教程

背景
一、下载部署LLaMa-Factory
二、下载大模型
三、启动LLaMa-Factory
四、微调大模型

背景

LLaMA-Factory 是一个专为大语言模型（LLM）微调与推理而设计的开源框架，旨在简化模型训练、部署和应用的流程。它支持多种主流模型（如 LLaMA、Qwen、ChatGLM 等），并集成了 LoRA、QLoRA 等高效微调技术。LLaMA-Factory 提供统一的命令行接口、灵活的配置系统和可视化 Web UI，适用于科研、工业和个人项目的快速开发与部署。无论是文本生成、对话系统还是多模态任务，LLaMA-Factory 都能提供稳定、高效的解决方案。

一、下载部署LLaMa-Factory

直接从github拉取下载项目代码，然后创建虚拟环境（博主使用的是venv，env是虚拟环境名称）并安装一些相关的包

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
python3 -m venv env
source env/bin/activate
pip install -e ".[torch,metrics]" --no-build-isolation

输入命令如llamafactory-cli version下图显示则表示安装成功。
在这里插入图片描述

二、下载大模型

可以从huggingface或者魔塔社区下载大模型，下载成功后需记住保存的地址，后续微调需要使用，以Qwen2.5-1.5B为例下载好的文件目录如下。
在这里插入图片描述

三、启动LLaMa-Factory

输入指令：llamafactory-cli webui 启动llama-factory的webui
在这里插入图片描述
启动成功后在浏览器中打开http://127.0.0.1:7860，可以先选择chat模式测试大模型是否可以成功加载。

模型的地址就是刚才下载保存的地址，注意模型名称要和地址下的名称所对应，这里我选的是vllm部署，点击加载模型即可向大模型提问。
在这里插入图片描述

四、微调大模型

由此便成功实现了直观的交互式的大模型微调，通过选择不同的模型、微调模式、数据集，设置不同的训练参数进行微调，最终还可以导出微调后合并的模型。各种参数模式的设置大家加油探索吧！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

捡起python之：简单的任务系统

工作需要加之ai技术的应用再一次使python全面称王，博主大二时学习了python，现在需要捡一捡，今天的小项目是：简单的任务系统。

2048 AI社区

【AI】实战案例：用提示词生成微服务架构设计的思路

本文通过三个实战案例（电商订单、物流跟踪、在线教育）详细讲解如何用AI提示词生成微服务架构设计思路。每个案例包含需求分析、提示词设计、AI输出解析三部分，重点说明如何通过明确业务场景、核心功能、非功能需求等要素，让AI输出可落地的设计方案。案例展示了服务拆分、接口设计、中间件选型、性能优化等关键环节，并提供可直接复用的技术栈配置建议，帮助开发者快速构建符合业务需求的微服务架构。