‌Stable Diffusion云部署实战：AWS/GCP/Azure环境配置指南‌

本指南覆盖了AWS、GCP和Azure的Stable Diffusion云部署全流程。推荐初学者从AWS开始（文档丰富），GCP适合集成AI服务，Azure适合企业级应用。部署后，通过WebUI测试生成图像（如输入提示词）。真实部署中，可能需调整模型参数或添加插件（如ControlNet）。建议参考官方GitHub仓库获取最新更新。如有具体问题，可提供更多细节，我会进一步协助！

2501_93878068

757人浏览 · 2025-10-24 17:40:11

2501_93878068 · 2025-10-24 17:40:11 发布

以下是为您准备的“Stable Diffusion云部署实战：AWS/GCP/Azure环境配置指南”。本指南基于真实可靠的部署经验（参考Stable Diffusion官方文档和云平台最佳实践），逐步指导您在AWS、Google Cloud Platform (GCP) 和 Microsoft Azure上配置环境并部署Stable Diffusion模型。Stable Diffusion是一个开源的文本到图像生成模型，部署在云上可充分利用GPU资源，实现高效推理。

通用准备（所有平台通用步骤）

在开始平台特定配置前，需完成以下基础设置：

安装必要工具：

安装Python 3.8+（推荐使用Miniconda管理环境）：

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
sh Miniconda3-latest-Linux-x86_64.sh
conda create -n sd_env python=3.10
conda activate sd_env

安装Git和Docker：

sudo apt-get update
sudo apt-get install git docker.io
sudo systemctl start docker

克隆Stable Diffusion仓库：

下载官方仓库（如Stable Diffusion WebUI）：

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui

准备模型文件：
- 从Hugging Face下载预训练模型（如v1-5-pruned.ckpt），并放置在models/Stable-diffusion目录。
设置环境变量：
- 确保GPU驱动兼容（需NVIDIA GPU），验证CUDA版本：
```
nvidia-smi  # 检查驱动状态
```

AWS环境配置指南

AWS使用EC2实例提供GPU支持。推荐实例类型：g4dn.xlarge（性价比高）或p3.2xlarge（高性能）。

创建EC2实例：
- 登录AWS控制台，启动EC2实例。
- 选择Amazon Linux 2 AMI（或Ubuntu 22.04 LTS）。
- 实例类型选GPU优化型，添加存储（至少50GB SSD）。
- 安全组配置：允许HTTP（端口80）、HTTPS（443）和自定义端口（如7860用于WebUI）。

安装GPU驱动和依赖：

连接实例后，安装NVIDIA驱动和CUDA：

sudo yum install -y kernel-devel-$(uname -r) kernel-headers-$(uname -r)
distribution=$(. /etc/os-release;echo $ID$VERSION_ID | sed -e 's/\.//g')
wget https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/cuda-keyring_1.0-1_all.deb
sudo dpkg -i cuda-keyring_1.0-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-drivers

安装Python依赖：

pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu117
pip install -r requirements.txt  # 在stable-diffusion-webui目录运行

启动Stable Diffusion：
- 使用Docker运行（推荐，避免依赖冲突）：
```
docker run -it --gpus all -p 7860:7860 -v $(pwd)/models:/app/models ghcr.io/stable-diffusion-webui:latest
```
- 或直接运行WebUI：
```
python launch.py --listen --port 7860
```
- 访问http://<EC2-public-IP>:7860测试部署。
优化与监控：
- 使用AWS CloudWatch监控GPU利用率。
- 启用Auto Scaling应对流量高峰。

GCP环境配置指南

GCP使用Compute Engine GPU实例。推荐实例类型：n1-standard-4搭配NVIDIA T4 GPU。

创建Compute Engine实例：
- 登录GCP控制台，创建VM实例。
- 选择Ubuntu 22.04 LTS镜像。
- 添加GPU：在“Machine configuration”中选NVIDIA T4，并启用GPU驱动。
- 防火墙规则：允许tcp:7860。

安装驱动和依赖：

连接实例后，安装CUDA：

curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.0-1_all.deb
sudo dpkg -i cuda-keyring_1.0-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda

设置Python环境：
```
pip install -r requirements.txt
```

部署模型：

使用Docker简化部署：

docker run --rm -it -p 7860:7860 --gpus all -v /path/to/models:/models stablediffusion/webui:latest

访问http://<VM-external-IP>:7860验证。

存储与集成：
- 将模型文件存储在Google Cloud Storage桶中，挂载到VM。
- 使用Cloud Logging记录日志。

Azure环境配置指南

Azure使用Virtual Machines with GPU。推荐SKU：Standard_NC6s_v3（配备NVIDIA V100 GPU）。

创建虚拟机：
- 登录Azure Portal，创建Linux VM（选Ubuntu Server 22.04 LTS）。
- 大小选GPU系列（如NCv3），添加SSD磁盘（最小64GB）。
- 网络配置：添加入站规则，允许端口7860。

安装驱动和依赖：

连接VM后，安装NVIDIA驱动：

sudo apt-get install -y linux-headers-$(uname -r)
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.0-1_all.deb
sudo dpkg -i cuda-keyring_1.0-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-drivers

安装Python包：
```
pip install -r requirements.txt
```

启动服务：

运行Stable Diffusion WebUI：
```
python launch.py --listen --port 7860
```

或使用Docker容器：

docker run -d --gpus all -p 7860:7860 -v /mnt/models:/app/models stable-diffusion-webui

访问http://<VM-public-IP>:7860测试。

成本控制：
- 使用Azure Spot Instances降低成本。
- 设置Auto-shutdown计划。

常见问题与优化

GPU驱动问题：确保CUDA版本匹配（Stable Diffusion要求CUDA 11.x）。运行nvidia-smi检查。
端口无法访问：检查云平台防火墙规则和安全组设置。
性能优化：
- 使用Docker简化环境隔离。
- 监控资源：在AWS用CloudWatch，GCP用Cloud Monitoring，Azure用Monitor。
- 调整实例大小：根据负载选择（小型测试用单GPU，生产用多GPU）。
成本估算：
- AWS：g4dn.xlarge约$0.526/小时。
- GCP：n1-standard-4 with T4约$0.47/小时。
- Azure：NC6s_v3约$0.90/小时。
安全建议：启用VPC私有网络，使用SSH密钥认证，定期更新模型。