从零开始学大模型:LLaMA Factory微调框架全解析,附环境配置与效果展示,建议收藏!
LLaMA Factory是一款开源大语言模型微调框架,支持100+种主流模型微调与部署。本文详细介绍了其环境配置与安装步骤,包括git安装、conda环境创建、依赖安装等,并展示了如何通过命令行和gradio启动框架。该框架具有模型丰富、训练效率高(支持LoRA、QLoRA)、界面友好(零代码Web UI)、功能完整(覆盖全流程)等特点,帮助用户快速构建定制化大语言模型应用。
什么是 LLaMA Factory?
LLaMA Factory 是一个开源的大语言模型微调框架,它提供了一套高效、易用的工具集,支持多种主流大语言模型(如 LLaMA、ChatGLM、Qwen 等)的微调与部署。该框架具有以下突出特点:
·支持模型丰富:兼容 100+ 种大语言模型,涵盖 LLaMA、Baichuan、ChatGLM、Qwen 等主流架构
·训练效率高:集成多种高效微调技术(LoRA、QLoRA 等),大幅降低显存需求
·界面友好:提供直观的 Web UI,支持零代码操作的模型训练与推理
·功能完整:覆盖模型预训练、指令微调、奖励模型训练等全流程
无论您是研究者、开发者还是企业用户,LLaMA Factory 都能帮助您快速构建和定制专属的大语言模型应用。
环境配置与LLaMA Factory安装
**一、**安装git
在终端中执行以下命令,安装 Git 版本工具:
sudo apt install git
二、下载LLama-factory
使用 Git 克隆 LLaMA Factory 项目仓库:
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

三、安装conda
1、安装Conda 所需依赖:
sudo apt install libgl1-mesa-glx libegl1-mesa libxrandr2 libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6

2、下载conda 安装包
wget https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh

3、安装conda
bash Anaconda3-2024.10-1-Linux-x86_64.sh
一路回车和yes,注意: 终端出现Anaconda3 will now be installed into this location:可输入自定义路径进而支持自定义conda安装路径(直接回车会默认安装到HOME目录)。


4、conda配置环境,默认没有配置环境(如下图)

查看conda安装位置

输入 nano ~/.bashrc

在bashrc文件的最后一行加入:export PATH=/home/ad/anaconda3/bin:$PATH (ad是自己的用户名)。按Ctrl+x 保存并退出编辑

配置生效

用conda -V查看版本正常了

四、创建环境
1、创建llama-factory微调环境
conda create -n llama-factory python=3.10


激活环境
conda activate llama-factory
我这里配置环境后直接进入激活环境报错(要先初始化)

解决:
source activate(重新进入虚拟环境)
conda deactivate (退出性能环境)
conda activate llama-factory(重新激活虚拟环境)
2、进入llama-factory环境后,进入到LLama-Factory文件下,安装相关依赖
pip install -e “.[torch,metrics]” --no-build-isolation -i https://mirrors.aliyun.com/pypi/simple


3、启动LLama-Factory

(这里我用的是虚拟机ubuntu20.4安装LLama-Factory,可以在win系统下通过虚拟机IP地址访问LLama-Factory界面)

ubuntu可视化系统也能访问LLama-Factory

五、gradio公开域名微调
如果ubuntu是服务器版本没有桌面的,你又想使用图形化微调,可以通过gradio创建公开域名链接进行微调
0表示第一张显卡:CUDA_VISIBLE_DEVICES=0
1表示创建1个域名链接:GRADIO_SHARE=1
查看有多少张卡:
nvidia-smi -L

1、启动命令行:
CUDA_VISIBLE_DEVICES=0 GRADIO_SHARE=1 llamafactory-cli
gradio报错:

解决:
创建目录:mkdir -p /home/ad/.cache/huggingface/gradio/frpc

进入目录:cd /home/ad/.cache/huggingface/gradio/frpc

这个下载方式可能有问题:
wget https://github.com/gradio-app/gradio/raw/main/gradio/frpc_linux_amd64-O frpc_linux_amd64_v0.3

我用win浏览器下载,然后手动上传到frpc文件下:
链接:https://cdn-media.huggingface.co/frpc-gradio-0.3/frpc_linux_amd64

上传进frpc文件里,然后重命名 mv frpc_linux_amd64 frpc_linux_amd64_v0.3

添加权限 chmod +x frpc_linux_amd64_v0.3

启动 CUDA_VISIBLE_DEVICES=0 GRADIO_SHARE=1 llamafactory-cli webui

这样就生成了一条公开域名,你也可以分享给其他人用:
https://265175b551a47a2dd5.gradio.live/
至此你已经部署好了LLaMA Factory

训练效果展示

最后
为什么要学AI大模型
当下,⼈⼯智能市场迎来了爆发期,并逐渐进⼊以⼈⼯通⽤智能(AGI)为主导的新时代。企业纷纷官宣“ AI+ ”战略,为新兴技术⼈才创造丰富的就业机会,⼈才缺⼝将达 400 万!
DeepSeek问世以来,生成式AI和大模型技术爆发式增长,让很多岗位重新成了炙手可热的新星,岗位薪资远超很多后端岗位,在程序员中稳居前列。

与此同时AI与各行各业深度融合,飞速发展,成为炙手可热的新风口,企业非常需要了解AI、懂AI、会用AI的员工,纷纷开出高薪招聘AI大模型相关岗位。
最近很多程序员朋友都已经学习或者准备学习 AI 大模型,后台也经常会有小伙伴咨询学习路线和学习资料,我特别拜托北京清华大学学士和美国加州理工学院博士学位的鲁为民老师给大家这里给大家准备了一份涵盖了AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频 全系列的学习资料,这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
AI大模型系统学习路线
在面对AI大模型开发领域的复杂与深入,精准学习显得尤为重要。一份系统的技术路线图,不仅能够帮助开发者清晰地了解从入门到精通所需掌握的知识点,还能提供一条高效、有序的学习路径。

但知道是一回事,做又是另一回事,初学者最常遇到的问题主要是理论知识缺乏、资源和工具的限制、模型理解和调试的复杂性,在这基础上,找到高质量的学习资源,不浪费时间、不走弯路,又是重中之重。
AI大模型入门到实战的视频教程+项目包
看视频学习是一种高效、直观、灵活且富有吸引力的学习方式,可以更直观地展示过程,能有效提升学习兴趣和理解力,是现在获取知识的重要途径

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
海量AI大模型必读的经典书籍(PDF)
阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。
600+AI大模型报告(实时更新)
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
AI大模型面试真题+答案解析
我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多推荐



所有评论(0)