零基础大模型微调实战教程（5）环境搭建 - 虚拟环境创建

文章摘要本文详细介绍了Python虚拟环境的创建和使用方法。虚拟环境是独立的Python运行环境，能解决版本冲突、依赖混乱等问题。文章通过图表展示了虚拟环境的结构和工作原理，并提供了创建、激活、管理虚拟环境的详细步骤和命令。主要内容包括：虚拟环境的概念与优势、创建四步曲（打开终端→创建环境→激活环境→验证环境）、文件夹结构解析、常用命令汇总以及常见问题解决方案。通过虚拟环境，开发者可以为每个项目

黑客思维者

760人浏览 · 2026-01-13 11:00:06

黑客思维者 · 2026-01-13 11:00:06 发布

第2章：环境搭建 - 零基础配置指南（续）

2.2 虚拟环境创建

2.2.1 什么是虚拟环境？为什么需要它？

虚拟环境（Virtual Environment） 是Python中的一个重要概念，它允许你创建独立的Python运行环境，每个环境可以有自己独立的库版本，而不会相互干扰。

专业术语解释：

术语	解释	来源	类比
虚拟环境	一个独立的Python运行环境，包含自己的解释器、库和脚本	Python标准库中的venv模块	就像公寓楼里的独立房间，每个房间有自己的水电系统
依赖（Dependency）	项目运行所必需的外部库或软件包	软件开发术语	就像做菜需要的各种食材和调料
隔离（Isolation）	不同环境之间互不干扰的特性	计算机科学概念	就像酒店房间，每个客人有自己的空间
requirements.txt	记录项目所有依赖及其版本的文件	Python包管理约定	就像药品的配方表，确保每次制作效果相同

2.2.2 虚拟环境的工作原理

让我们看看虚拟环境是如何工作的：

2.2.3 创建虚拟环境的详细步骤

现在，让我们按照教程中的命令一步步创建虚拟环境：

详细命令解释：

# 命令1：创建虚拟环境
python -m venv llm_tutorial

# 分解解释：
# python        -> 调用Python解释器
# -m venv       -> 运行venv模块（Python内置的虚拟环境模块）
# llm_tutorial  -> 虚拟环境名称，也是创建的文件夹名

# 命令2：激活虚拟环境（Windows）
llm_tutorial\Scripts\activate

# 分解解释：
# llm_tutorial\Scripts\ -> 虚拟环境中的Scripts文件夹路径
# activate              -> 激活脚本

# 命令3：激活虚拟环境（Mac/Linux）
source llm_tutorial/bin/activate

# 分解解释：
# source         -> Shell命令，执行脚本并使其生效
# llm_tutorial/bin/activate -> 激活脚本路径

激活后的终端变化：

# 激活前：
C:\Users\你的名字>

# 激活后：
(llm_tutorial) C:\Users\你的名字>

这个(llm_tutorial)前缀就是虚拟环境的标志，表示你正在这个环境中工作。

2.2.4 虚拟环境文件夹结构详解

创建虚拟环境后，让我们看看里面有什么：

关键文件说明：

pyvenv.cfg：虚拟环境的配置文件
activate脚本：激活虚拟环境的脚本
python可执行文件：虚拟环境专用的Python解释器
site-packages目录：所有第三方库安装的位置

2.2.5 虚拟环境常用命令

除了创建和激活，还需要掌握其他几个重要命令：

mindmap
  root((虚拟环境核心命令))
    
    创建环境
      基本创建: python -m venv 环境名
      指定Python版本: virtualenv -p python3.8 环境名
      包含系统包: python -m venv --system-site-packages 环境名
    
    激活环境
      Windows: 环境名\Scripts\activate
      Mac/Linux: source 环境名/bin/activate
      PowerShell: 环境名\Scripts\Activate.ps1
      注意: 激活后提示符变化
    
    退出环境
      通用命令: deactivate
      直接关闭终端也会退出
      但环境配置保持不变
    
    删除环境
      最简单方法: 直接删除环境文件夹
      安全删除: 先退出环境再删除
      注意: 不要删除正在使用的环境
    
    环境复制
      导出依赖: pip freeze > requirements.txt
      新建环境: python -m venv 新环境
      安装依赖: pip install -r requirements.txt
    
    环境信息
      查看Python位置: which python 或 where python
      查看已安装包: pip list
      查看环境路径: python -c "import sys; print(sys.path)"

2.2.6 常见问题与解决方案

问题1：'python’不是内部或外部命令

症状：输入python命令时提示找不到
解决方案：
1. 检查Python是否已安装并添加到PATH
2. 尝试使用py命令：py -m venv llm_tutorial
3. 或者使用完整路径：C:\Python39\python.exe -m venv llm_tutorial

问题2：激活脚本无法执行（Windows）

问题3：虚拟环境激活后pip不可用

症状：激活环境后，pip命令报错或找不到
解决方案：
1. 确保在虚拟环境激活状态下
2. 尝试使用python -m pip install ...
3. 重新安装pip：python -m ensurepip --upgrade
4. 如果还不行，重新创建虚拟环境

问题4：如何在不同项目间切换？

# 假设你有两个项目，每个都有自己的虚拟环境
项目A：环境名为env_a
项目B：环境名为env_b

# 切换到项目A
source env_a/bin/activate  # Mac/Linux
env_a\Scripts\activate     # Windows

# 工作完成后退出
deactivate

# 切换到项目B
source env_b/bin/activate  # Mac/Linux
env_b\Scripts\activate     # Windows

2.3 必备库安装

2.3.1 为什么需要这些特定的库？

在开始大模型微调之前，我们需要安装一些核心库。每个库都有特定的作用：

2.3.2 库的详细介绍

1. PyTorch - 深度学习框架

PyTorch是由Facebook开发的开源深度学习框架，以其动态计算图和易用性而闻名。

特性	说明	优势
动态计算图	运行时构建计算图，便于调试	可以像普通Python代码一样调试
张量计算	类似NumPy的多维数组	GPU加速，性能优异
自动求导	自动计算梯度	简化神经网络训练
丰富的API	提供各种神经网络层和优化器	快速构建复杂模型

2. Transformers - 预训练模型库

Transformers由Hugging Face开发，提供了数千种预训练模型和易用的API。

3. Datasets - 数据集处理库

Datasets同样由Hugging Face开发，提供了高效的数据加载和处理功能。

主要特性：

一键加载常见数据集（如IMDB、SQuAD等）
流式处理大规模数据
内存映射，节省内存
丰富的预处理功能

4. PEFT - 参数高效微调库

PEFT（Parameter-Efficient Fine-Tuning） 实现了多种高效微调方法，如LoRA、Prefix Tuning等。

为什么需要PEFT：

全参数微调需要大量计算资源
PEFT只需微调少量参数（通常<1%）
保持模型原有能力，避免灾难性遗忘

5. Accelerate - 训练加速库

Accelerate简化了分布式训练，让你可以轻松在多个GPU或TPU上训练模型。

主要功能：

自动处理设备放置（CPU/GPU/TPU）
混合精度训练
梯度累积
分布式数据并行

6. Bitsandbytes - 量化优化库

Bitsandbytes提供了8位优化器和4位量化功能，大幅减少内存占用。

量化类型：

8位优化器：将优化器状态从32位压缩到8位
4位量化：将模型权重从32位压缩到4位
双重量化：进一步压缩量化参数

2.3.3 安装步骤详解

现在让我们按照教程中的命令进行安装：

详细命令分析：

# 命令1：安装PyTorch（CPU版本）
pip install torch --index-url https://download.pytorch.org/whl/cpu

# 分解解释：
# pip install torch    -> 安装torch包
# --index-url          -> 指定包索引URL
# https://download.pytorch.org/whl/cpu  -> PyTorch官方CPU版本仓库

# 为什么用CPU版本？
# 1. 不需要GPU也能运行
# 2. 文件较小，下载快
# 3. 适合学习和小规模实验

# 命令2：安装其他核心库
pip install transformers datasets peft accelerate

# 分解解释：
# transformers -> Hugging Face的Transformers库
# datasets     -> Hugging Face的Datasets库
# peft         -> 参数高效微调库
# accelerate   -> 分布式训练加速库

# 命令3：安装bitsandbytes（可选）
pip install bitsandbytes

# 注意：这个库在Windows上可能安装困难
# 如果失败，可以暂时跳过，后续有替代方案

2.3.4 安装过程中的常见问题

问题1：PyTorch安装太慢或超时

问题2：依赖冲突

症状：安装时提示版本冲突，如：
ERROR: Cannot install torch==2.0.1 and torch==1.13.1

原因：不同库可能依赖同一库的不同版本

解决方案：
1. 创建新的虚拟环境，从头安装
2. 安装时指定兼容版本
3. 使用conda环境（管理依赖更智能）

问题3：bitsandbytes在Windows上安装失败

这是最常见的问题，因为bitsandbytes对Windows支持有限。

# 替代方案1：使用预编译的Windows版本
# 访问：https://github.com/jllllll/bitsandbytes-windows-webui
# 下载对应Python版本的whl文件
pip install bitsandbytes-0.xx.x-py3-none-win_amd64.whl

# 替代方案2：跳过bitsandbytes
# 我们的教程中，bitsandbytes主要用于4位量化
# 如果跳过，可以使用其他量化方法或使用更高内存

# 替代方案3：使用Linux子系统（WSL）
# 在Windows上安装WSL，然后在Linux环境中安装

2.3.5 验证安装是否成功

安装完成后，我们需要验证每个库是否能正常工作：

创建验证脚本 check_installation.py：

"""
大模型微调环境验证脚本
检查所有必要库是否安装成功
"""

print("=" * 50)
print("大模型微调环境验证")
print("=" * 50)

# 检查Python版本
import sys
print(f"Python版本: {sys.version[:6]}")

# 1. 检查PyTorch
try:
    import torch
    print(f"✅ PyTorch版本: {torch.__version__}")
    print(f"   设备: {'GPU可用' if torch.cuda.is_available() else '仅CPU'}")
except ImportError:
    print("❌ PyTorch未安装")

# 2. 检查Transformers
try:
    import transformers
    print(f"✅ Transformers版本: {transformers.__version__}")
except ImportError:
    print("❌ Transformers未安装")

# 3. 检查Datasets
try:
    import datasets
    print(f"✅ Datasets版本: {datasets.__version__}")
except ImportError:
    print("❌ Datasets未安装")

# 4. 检查PEFT
try:
    import peft
    print(f"✅ PEFT版本: {peft.__version__}")
except ImportError:
    print("❌ PEFT未安装")

# 5. 检查Accelerate
try:
    import accelerate
    print(f"✅ Accelerate版本: {accelerate.__version__}")
except ImportError:
    print("❌ Accelerate未安装")

# 6. 检查Bitsandbytes
try:
    import bitsandbytes
    print("✅ Bitsandbytes已安装")
except ImportError:
    print("⚠️ Bitsandbytes未安装（可选，可跳过）")

print("\n" + "=" * 50)
print("环境验证完成！")
print("=" * 50)

# 测试基本功能
print("\n测试基本功能...")
try:
    # 测试PyTorch基本功能
    x = torch.tensor([1, 2, 3])
    print(f"PyTorch张量测试: {x + 1}")
    
    # 测试Transformers基本功能
    from transformers import pipeline
    print("Transformers管道测试: 通过")
    
    print("\n🎉 所有测试通过！环境配置成功！")
except Exception as e:
    print(f"\n⚠️ 测试过程中出现错误: {e}")

运行验证脚本：

# 确保在虚拟环境中
python check_installation.py

# 期望输出：
# ==================================================
# 大模型微调环境验证
# ==================================================
# Python版本: 3.9.13
# ✅ PyTorch版本: 2.0.1
#    设备: 仅CPU
# ✅ Transformers版本: 4.30.0
# ✅ Datasets版本: 2.12.0
# ✅ PEFT版本: 0.4.0
# ✅ Accelerate版本: 0.20.0
# ⚠️ Bitsandbytes未安装（可选，可跳过）
# 
# ==================================================
# 环境验证完成！
# ==================================================

2.3.6 环境管理最佳实践

创建requirements.txt文件：

# 导出当前环境的所有依赖
pip freeze > requirements.txt

# requirements.txt示例内容：
torch==2.0.1
transformers==4.30.0
datasets==2.12.0
peft==0.4.0
accelerate==0.20.0
numpy==1.24.3
tqdm==4.65.0

# 在新环境中恢复
pip install -r requirements.txt

本章总结

完成检查清单

关键知识点回顾

虚拟环境的核心价值：隔离项目依赖，避免版本冲突
venv模块的使用：python -m venv 环境名
激活与退出：activate/deactivate
核心AI库的作用：
- PyTorch：深度学习框架
- Transformers：预训练模型库
- Datasets：数据集处理
- PEFT：高效微调方法
- Accelerate：分布式训练
- Bitsandbytes：量化优化
依赖管理：使用requirements.txt记录和恢复环境

下一步：开始真正的AI项目！

现在，你的开发环境已经完全准备好了！在下一章中，我们将：

加载第一个预训练模型
进行文本生成或分类任务
理解模型的基本工作原理
为微调准备数据

你已经成功搭建了AI开发环境，就像宇航员准备好了航天服，即将开始激动人心的AI探索之旅！

实践作业

请完成以下任务：

任务一：创建虚拟环境my_ai_env，激活它，并截图显示激活状态。
任务二：在虚拟环境中安装所有必备库，运行验证脚本，截图显示成功信息。
任务三：导出当前环境的依赖到requirements.txt，查看文件内容，理解每一行的含义。
挑战任务：在新目录中创建新虚拟环境，使用requirements.txt快速重建相同环境，验证是否成功。

完成这些任务后，请回答以下问题：

如果不使用虚拟环境，直接安装所有库到系统Python中，可能会遇到什么问题？
为什么我们安装PyTorch的CPU版本而不是GPU版本？
如果要在另一台电脑上重现你的环境，需要哪些步骤？

遇到问题如何解决？

仔细阅读错误信息：错误信息通常会告诉你问题所在
搜索引擎是你的朋友：复制错误信息到百度或Google搜索
查阅官方文档：访问库的官方GitHub或文档网站
技术社区求助：Stack Overflow、知乎、CSDN等
简化问题：尝试最小化复现步骤，排除干扰因素

记住：环境配置是学习编程中最具挑战性的部分之一，每一个程序员都经历过这个阶段。你已经克服了最大的障碍，接下来就是更有趣的AI学习了！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

GitHub超有用项目推荐：skill仓库--用技能树打造AI超频引擎

2048 AI社区

一天一个开源项目（第55篇）：Spec Kit - GitHub 开源的规范驱动开发工具包

深入解读 Spec Kit，GitHub 开源的规范驱动开发（Spec-Driven Development）工具包，让规范可执行，从 constitution → specify → plan → tasks → implement 结构化工作流，支持 Claude Code、Cursor、Copilot 等 20+ AI 编码助手

2048 AI社区

技术赋能背景下B端拓客号码核验的困境突破与行业发展氪迹科技法人股东号码核验系统

【摘要】B端市场竞争加剧背景下，企业决策人号码核验成为拓客关键环节，但传统服务面临精准度不足（普遍低于85%）、成本高企（百万级数据核验需5000-6000元）和数据滞后三大痛点，导致拓客团队陷入"高投入低产出"困境。新型技术方案通过实时算力与AI算法实现三大突破：精准度提升至98%，实时更新消除数据滞后，成本降至行业1/3（百万数据仅2000元）。该模式已应用于电销、金融等多