Как запустить Stable Diffusion на MacBook
Пошаговая инструкция по запуску Stable Diffusion на MacBook с Apple Silicon — от установки до оптимизации.
Apple Silicon изменил расклад для локальной генерации изображений. Чипы M1, M2, M3 и M4 с унифицированной памятью и встроенным GPU позволяют запускать Stable Diffusion без внешней видеокарты — и получать приемлемую скорость генерации. MacBook Air с 16 ГБ оперативной памяти создаёт изображение 512×512 за 15–30 секунд в зависимости от модели. Разберём, как это настроить.
Какие чипы подходят
Stable Diffusion работает на всех чипах Apple Silicon: M1, M1 Pro/Max/Ultra, M2 и более новых. Разница — в скорости генерации и поддерживаемых разрешениях. Для комфортной работы нужно минимум 16 ГБ унифицированной памяти. На моделях с 8 ГБ генерация возможна, но с ограничениями: максимальное разрешение 512×512, модели SDXL не поместятся.
Ориентировочная скорость генерации изображения 512×512 (20 шагов): M1 — 30 сек, M2 — 22 сек, M3 Pro — 15 сек, M4 Pro — 10 сек. Для сравнения: облачные генераторы создают изображение за 5–10 секунд, но требуют подписки.
Способ 1: Draw Things (самый простой)
Draw Things — бесплатное приложение из Mac App Store, оптимизированное под Apple Silicon. Установка — один клик, без терминала и Python. Приложение само загружает модели и настраивает Metal-ускорение.
Поддерживаемые модели: Stable Diffusion 1.5, 2.1, SDXL, Stable Diffusion 3, а также кастомные модели в формате SafeTensors. Draw Things позволяет загружать LoRA-адаптеры и использовать ControlNet.
Для начинающих Draw Things — оптимальный выбор. Интерфейс понятный, результаты предсказуемые, обновления приходят автоматически.
Способ 2: Diffusers от Hugging Face
Для разработчиков и тех, кто хочет больше контроля, подходит библиотека Diffusers с поддержкой MPS (Metal Performance Shaders):
pip install diffusers transformers accelerate torchimport torch
from diffusers import StableDiffusionPipeline
pipe = StableDiffusionPipeline.from_pretrained(
"stabilityai/stable-diffusion-2-1",
torch_dtype=torch.float16
)
pipe = pipe.to("mps") # Используем Apple GPU
image = pipe("futuristic city at sunset, digital art").images[0]
image.save("result.png")Ключевой параметр — torch_dtype=torch.float16. Половинная точность сокращает потребление памяти вдвое и ускоряет генерацию на 30–40% без заметной потери качества.
Способ 3: ComfyUI с Metal
ComfyUI — интерфейс на основе нод-графов для продвинутой работы с генерацией. Установка на Mac:
git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
pip install -r requirements.txt
python main.py --force-fp16Флаг --force-fp16 обязателен для Apple Silicon — без него модели будут использовать fp32 и работать значительно медленнее. ComfyUI автоматически определяет MPS-устройство и использует Metal для ускорения.
ComfyUI удобен для сложных workflow: комбинирование моделей, пакетная генерация, автоматические пайплайны. Для простой генерации «промпт → картинка» Draw Things проще.
Оптимизация производительности
Несколько приёмов для ускорения генерации на Mac:
Core ML-модели. Apple предоставляет конвертированные модели в формате Core ML, оптимизированные под Neural Engine. Они работают на 30–50% быстрее PyTorch-версий. Загрузить можно через apple/ml-stable-diffusion на Hugging Face.
Закройте лишние приложения. Унифицированная память делится между CPU и GPU. Браузер с 50 вкладками отнимает память, которая могла бы пойти на генерацию. 16 ГБ — это комфортный минимум при закрытых приложениях.
Используйте шедулеры с меньшим числом шагов. DPM++ 2M Karras или Euler a дают хорошие результаты за 15–20 шагов вместо стандартных 50. Это сокращает время генерации в 2–3 раза.
Разрешение. Генерируйте в нативном разрешении модели (512×512 для SD 1.5, 1024×1024 для SDXL) и масштабируйте апскейлером. Генерация в произвольном разрешении — медленнее и часто даёт артефакты.
Модели для Mac
Не все модели одинаково хорошо работают на Apple Silicon. Проверенные варианты:
Stable Diffusion 1.5 — быстрая генерация, огромная экосистема LoRA-адаптеров. Идеальна для 8 ГБ RAM.
SDXL — качество выше, но требует 16 ГБ RAM. На M1 с 16 ГБ работает, но медленно (40–60 секунд на изображение).
Stable Diffusion 3 Medium — новейшая архитектура MMDiT. Требует 16+ ГБ, но даёт лучшее качество текста на изображениях и понимание сложных промптов.
FLUX.1-schnell — оптимизированная модель от Black Forest Labs. Быстрая генерация за 4 шага при достойном качестве.
Когда Mac недостаточно
Для профессиональной работы с генерацией изображений (пакетная обработка, тренировка LoRA, высокие разрешения) MacBook уступает десктопу с Nvidia RTX 4090. Если генерация — основной рабочий инструмент, стоит рассмотреть облачные решения или сборку на Nvidia. Для экспериментов, прототипирования и периодической генерации MacBook достаточно.
Запуск Stable Diffusion на Mac: требования и варианты
Apple Silicon (M1, M2, M3, M4) поддерживает Stable Diffusion через Metal Performance Shaders — GPU-ускорение через фреймворк Apple. Скорость генерации на Mac значительно выросла с выходом SD 1.5 и SDXL-оптимизаций для MPS.
Производительность по чипам Apple
| Чип Mac | Unified Memory | SD 1.5 (512×512) | SDXL (1024×1024) | SD 3.5 Medium |
|---|---|---|---|---|
| M1 (8GB) | 8GB | ~15 сек/изображение | Не запускается | Не запускается |
| M1 Pro (16GB) | 16GB | ~8 сек | ~60 сек | Медленно |
| M2 Pro (16GB) | 16GB | ~5 сек | ~35 сек | ~120 сек |
| M3 Max (36GB) | 36GB | ~2 сек | ~12 сек | ~40 сек |
| M4 Max (48GB) | 48GB | ~1.5 сек | ~8 сек | ~25 сек |
Варианты установки на Mac
1. AUTOMATIC1111 WebUI (самый популярный)
Установка через Homebrew и Python venv. Поддерживает MPS-ускорение с флагом --use-pytorch-attention. Большинство расширений работают, но некоторые несовместимы с MPS. Рекомендуется для пользователей, которые хотят максимальную экосистему плагинов.
2. ComfyUI (лучшая производительность)
ComfyUI на M-чипах работает быстрее AUTOMATIC1111 благодаря лучшей оптимизации MPS. Node-граф workflow удобен для создания автоматизированных пайплайнов. Рекомендуется для продвинутых пользователей.
3. Diffusers + Python (для разработчиков)
Библиотека HuggingFace Diffusers поддерживает device="mps" из коробки. Оптимальна для интеграции в собственные приложения на Python.
4. Draw Things (App Store)
Нативное macOS/iOS приложение с оптимизацией для Apple Silicon. Простейшая установка (App Store), хорошая производительность, без терминала. Идеально для нетехнических пользователей.
Оптимизация для Mac
Выбор модели: SD 1.5 запускается на любом M-чипе. SDXL требует минимум 12–16GB Unified Memory. Для комфортной работы с SD 3.5 нужно 24GB+.
Квантизация: используйте GGUF-форматы моделей для снижения требований к памяти. Q4_K_M даёт хорошее соотношение качества и размера.
VAE и CLIP: загружайте в fp16 вместо fp32 — вдвое меньше памяти без заметной потери качества.