简介：本文为开发者提供ComfyUI的完整安装部署指南，涵盖环境准备、依赖安装、系统配置及常见问题解决方案，帮助用户快速搭建稳定高效的图形化AI开发环境。

ComfyUI完全入门：安装部署指南

引言

ComfyUI作为一款基于PyTorch的图形化AI开发框架，以其模块化设计和直观的操作界面受到开发者青睐。本文将系统讲解ComfyUI的安装部署全流程，从环境准备到运行优化，帮助用户快速搭建稳定的工作环境。

一、系统环境准备

1.1 硬件要求

基础配置：建议使用NVIDIA GPU（CUDA 11.x/12.x兼容），显存≥8GB
推荐配置：RTX 3060及以上显卡，CPU i5-10400F或同等级别，32GB内存
存储需求：至少50GB可用空间（含模型存储）

1.2 软件依赖

操作系统：Windows 10/11（64位）或Linux（Ubuntu 20.04 LTS+）
Python环境：3.8-3.11版本（推荐3.10）
CUDA工具包：与显卡驱动匹配的版本（通过nvidia-smi查看）

⚠️ 版本冲突是常见问题，建议使用conda创建独立环境：
conda create -n comfy_env python=3.10
conda activate comfy_env

二、安装流程详解

2.1 基础安装方式

方式一：通过pip安装（推荐）

pip install comfyui
# 验证安装
python -c "import comfy; print(comfy.__version__)"

方式二：源码安装（开发版）

git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt

2.2 关键依赖项

依赖包	版本要求	作用说明
torch	≥1.12	深度学习计算核心
xformers	最新	优化注意力计算（可选）
onnxruntime	1.15+	ONNX模型支持（可选）

💡 性能优化建议：安装xformers可提升30%以上的注意力计算速度

2.3 模型文件配置

从HuggingFace下载预训练模型：

git lfs install
git clone https://huggingface.co/stabilityai/sdxl-1.0

将模型文件放入ComfyUI/models/checkpoints目录

配置config.json指定模型路径：

{
  "checkpoint_path": "./models/checkpoints/sdxl-1.0.safetensors"
}

三、部署方案选择

3.1 本地开发部署

Windows配置要点：

安装Visual Studio 2022（勾选”C++桌面开发”）

设置环境变量：

PATH=%PATH%;C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\bin

运行命令：
```
python main.py --port 7860 --listen
```

Linux优化配置：

# 安装依赖
sudo apt install libgl1-mesa-glx libglib2.0-0
# 设置CUDA环境
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc

3.2 容器化部署（Docker）

FROM python:3.10-slim
WORKDIR /app
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt
COPY . .
CMD ["python", "main.py"]

构建并运行：

docker build -t comfyui .
docker run -d --gpus all -p 7860:7860 comfyui

四、常见问题解决方案

4.1 CUDA相关错误

现象：CUDA out of memory或CUDA driver version is insufficient

解决方案：

更新显卡驱动至最新版

降低batch size：

# 在config.json中添加
"training_args": {
  "batch_size": 4
}

检查CUDA版本匹配：

nvcc --version
python -c "import torch; print(torch.version.cuda)"

4.2 模型加载失败

典型错误：RuntimeError: Error(s) in loading state_dict

排查步骤：

确认模型文件完整性（SHA256校验）
检查模型类型与框架版本兼容性

尝试显式指定设备：

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

五、性能优化技巧

5.1 内存管理

使用torch.cuda.empty_cache()定期清理显存

启用梯度检查点（需修改模型配置）：

from torch.utils.checkpoint import checkpoint
# 在模型定义中替换部分forward操作

5.2 多GPU配置

# 在启动脚本中添加
import torch.distributed as dist
dist.init_process_group(backend='nccl')
model = torch.nn.parallel.DistributedDataParallel(model)

六、监控与维护

6.1 日志分析

ComfyUI默认生成logs/runtime.log，关键指标包括：

iter_time: 单次迭代耗时
mem_usage: 显存占用率
loss_value: 训练损失值

6.2 自动化维护脚本

#!/bin/bash
# 定期清理缓存
find /tmp -name "torch_*" -mtime +3 -delete
# 检查服务状态
netstat -tulnp | grep 7860

七、进阶部署方案

7.1 负载均衡配置

使用Nginx反向代理实现多实例负载均衡：

upstream comfy_servers {
  server 127.0.0.1:7860;
  server 127.0.0.1:7861;
}
server {
  listen 80;
  location / {
    proxy_pass http://comfy_servers;
  }
}

7.2 云服务部署

AWS EC2配置要点：

选择g4dn.xlarge实例（含NVIDIA T4显卡）

安装CUDA驱动：

sudo apt-get install -y nvidia-cuda-toolkit

使用AWS S3存储模型文件

结论

通过本文的详细指导，开发者可以完成从环境搭建到生产部署的全流程。关键成功要素包括：精确的版本控制、合理的资源分配、以及持续的性能监控。建议新手从本地开发环境入手，逐步过渡到容器化部署，最终实现高可用的云服务架构。

📌 延伸学习：完成安装后，可进一步探索ComfyUI的插件系统（如comfyui-manager）和自定义节点开发，这些功能将显著提升开发效率。

ComfyUI完全指南：从零开始的安装与部署