为什么要本地部署 Stable Diffusion?
Stable Diffusion(简称 SD)是目前最强大的开源 AI 图像生成模型。与 Midjourney 不同,SD 完全免费、可本地运行、不限次数、支持各种自定义模型和插件。本地部署的好处包括:
- **完全免费**:一次配置,无限使用,无需月费 - **无内容限制**:没有 Midjourney 的内容审查 - **高度自定义**:可以安装各种模型、LoRA、ControlNet - **隐私安全**:所有数据都在本地,不上传到云端 - **离线使用**:配置好后无需联网
缺点是需要一定的硬件配置和初始设置时间。本教程将手把手教你完成部署。
硬件要求
### 最低配置
- **GPU**:NVIDIA GTX 1060 6GB(必须是 NVIDIA 显卡) - **内存**:16GB RAM - **硬盘**:20GB 可用空间(推荐 SSD) - **系统**:Windows 10/11 或 Ubuntu 20.04+
### 推荐配置
- **GPU**:NVIDIA RTX 3060 12GB 或更高 - **内存**:32GB RAM - **硬盘**:100GB+ SSD(模型文件很大)
### 关于显存
显存(VRAM)是最关键的参数: - **6GB**:可以生成 512×512 图片,速度较慢 - **8GB**:可以流畅生成 512×512,勉强运行 768×768 - **12GB**:可以流畅生成 1024×1024,运行大多数功能 - **24GB**:随意使用所有功能,批量生成
没有 NVIDIA 独立显卡?可以考虑使用 Google Colab 或 RunPod 等云 GPU 服务。
安装 WebUI(Windows)
我们使用最流行的 Stable Diffusion WebUI(automatic1111 版)。
### 第一步:安装 Python
- 下载 Python 3.10.x(注意:目前推荐 3.10 版本)
- 安装时勾选「Add Python to PATH」
- 打开命令行,输入 `python --version` 确认安装成功
### 第二步:安装 Git
- 下载并安装 Git(git-scm.com)
- 命令行输入 `git --version` 确认安装成功
### 第三步:克隆 WebUI
打开命令行,执行:
```bash git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui ```
### 第四步:首次启动
双击 `webui-user.bat`,首次启动会自动下载所有依赖(需要较长时间)。完成后会显示一个本地 URL(通常是 `http://127.0.0.1:7860`),在浏览器中打开即可。
### 低显存优化
如果你的显存不足 8GB,编辑 `webui-user.bat`,在 `COMMANDLINE_ARGS=` 后面添加:
``` set COMMANDLINE_ARGS=--medvram --xformers ```
如果只有 4GB 显存:
``` set COMMANDLINE_ARGS=--lowvram --xformers ```
安装 WebUI(Mac)
Apple Silicon(M1/M2/M3)的 Mac 也可以运行 SD:
```bash git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui ./webui.sh ```
Mac 版会自动使用 MPS(Metal Performance Shaders)加速,M1 Pro 及以上的芯片效果不错。
模型下载与安装
### 基础模型(Checkpoint)
模型是 SD 的核心,不同模型生成不同风格的图片。
**热门模型推荐:** - **SD XL 1.0**:官方最新模型,效果全面提升 - **Realistic Vision**:写实人像效果最佳 - **DreamShaper**:梦幻艺术风格 - **Anything V5**:动漫风格经典模型
**下载来源:** - Civitai(civitai.com)— 最大的 SD 模型社区 - Hugging Face(huggingface.co)— 官方模型仓库
**安装方法:** 下载 `.safetensors` 文件,放入 `models/Stable-diffusion/` 目录,重启 WebUI 或点击刷新按钮即可。
### LoRA 模型
LoRA 是轻量级微调模型,可以在基础模型之上添加特定的风格或人物特征。
- 下载 `.safetensors` 文件 - 放入 `models/Lora/` 目录 - 在提示词中使用 `<lora:模型名:权重>` 调用
例如:`beautiful landscape <lora:add_detail:0.8>` 会启用 add_detail LoRA,权重 0.8。
ControlNet 使用
ControlNet 是 SD 最强大的扩展之一,可以通过参考图控制生成结果。
### 安装 ControlNet
- 在 WebUI 中打开「Extensions」标签页
- 点击「Install from URL」
- 输入:`https://github.com/Mikubill/sd-webui-controlnet.git`
- 点击「Install」,重启 WebUI
### 下载 ControlNet 模型
从 Hugging Face 下载 ControlNet 模型文件,放入 `extensions/sd-webui-controlnet/models/` 目录。
### 常用 ControlNet 模式
- **Canny**:边缘检测,保持轮廓不变 - **OpenPose**:人体姿势控制 - **Depth**:深度图,保持空间关系 - **Scribble**:涂鸦转精细图片 - **IP-Adapter**:风格参考,保持参考图的风格
参数调优指南
### 关键参数
- **Steps(采样步数)**:20-30 步通常足够,越多越精细但越慢 - **CFG Scale(提示词相关度)**:7-12 之间,越高越忠于提示词 - **Sampler(采样器)**:推荐 DPM++ 2M Karras 或 Euler a - **Seed(种子)**:-1 为随机,固定种子可复现结果
### 提示词结构
SD 的提示词和 Midjourney 有所不同:
**正面提示词(Positive Prompt):** ``` masterpiece, best quality, 1girl, long black hair, blue eyes, school uniform, cherry blossoms, spring, soft lighting, detailed face, detailed hands ```
**反面提示词(Negative Prompt):** ``` worst quality, low quality, blurry, bad hands, bad anatomy, deformed, extra limbs, watermark, text, signature ```
**权重控制**:用括号增加权重,如 `(blue eyes:1.3)` 增强蓝眼睛的效果。
常见问题排查
**Q:启动报错 CUDA out of memory** A:显存不足。尝试添加 `--medvram` 或 `--lowvram` 参数,或降低图片分辨率。
**Q:生成的图片质量很差** A:检查是否选择了正确的模型、Steps 是否太低(至少 20)、是否使用了 Negative Prompt。
**Q:安装扩展后 WebUI 无法启动** A:删除问题扩展的目录(在 `extensions/` 中),重新启动。
**Q:Mac 上生成速度很慢** A:Apple Silicon 的速度确实不如 NVIDIA GPU。建议降低分辨率,或使用云 GPU 服务。
小结
Stable Diffusion 的本地部署虽然初始设置稍复杂,但一旦配置完成,你将拥有一个无限制、无月费的 AI 图像生成工作站。建议先从基础模型开始,熟悉界面操作后再逐步尝试 LoRA、ControlNet 等高级功能。Civitai 社区是你探索新模型和学习提示词的最佳去处。
