Stable Diffusion 3.5

Gratis

Instalas ComfyUI, cargas SD 3.5 Large y generas 500 imágenes al día sin pagar suscripción — solo electricidad y una RTX con 8 GB VRAM. A julio de 2026, Stability AI no ha anunciado ningún modelo llamado SD4 en sus release notes oficiales (platform.stability.ai/docs/release-notes) — la familia insignia confirmada sigue siendo Stable Diffusion 3.5 (Large, Large Turbo, Medium), con Stable Image Ultra como servicio API flagship basado en SD 3.5 Large (0,08 $/img, platform.stability.ai/pricing). Los rumores de «SD4» en blogs de terceros carecen de respaldo oficial.

Ese ecosistema es la única opción de primer nivel ejecutable 100 % en local, con LoRAs, ControlNet e inpainting que ningún SaaS propietario replica a la misma escala. CivitAI ofrece miles de checkpoints para anime, fotorrealismo o estilo de marca. Flux (/herramienta/flux) compite en calidad out-of-the-box sin configuración; SD 3.5 gana en control granular, ecosistema comunitario y coste cero por imagen en hardware propio — su punto fuerte frente a FLUX.2 sigue siendo LoRAs, ControlNet y fine-tuning local, no calidad pura sin configuración.

Curva de aprendizaje real: samplers, CFG scale, gestión de modelos, nodos en ComfyUI. Automatic1111 abstrae parte del flujo, pero sigue siendo herramienta para perfiles técnicos o artistas dispuestos a invertir 10–20 horas de aprendizaje. Midjourney (/herramienta/midjourney) entrega resultados artísticos en 30 segundos sin tocar parámetros — trade-off clásico control vs velocidad.

Sin GPU local: API Stability en platform.stability.ai — Stable Image Core desde 0,03 $/img, SD 3.5 Large 0,065 $/img, Stable Image Ultra 0,08 $/img (1 crédito = 0,01 $). Replicate y fal.ai hospedan SD 3.5 con pay-per-second. RunDiffusion y Vast.ai alquilan GPU por hora (~0,30–0,80 $/h) para sesiones batch de cientos de imágenes.

Hardware mínimo: 8 GB VRAM para SD 3.5 en 512×512; 12–16 GB para resoluciones altas con LoRAs múltiples. RTX 3060 12 GB es sweet spot coste/rendimiento en 2026. Mac con Apple Silicon ejecuta via DiffusionBee o ComfyUI con Metal, más lento que NVIDIA.

Casos reales: estudio de videojuegos entrena LoRA de estilo pixel-art sobre SD 3.5 y genera 2.000 assets de entorno en batch local; agencia de e-commerce fine-tunea checkpoint de producto sobre fotos reales del cliente; investigador de ML estudia arquitecturas de difusión con pesos abiertos sin depender de API cerrada.

Comparativa DALL-E (/herramienta/dalle): DALL-E gana en facilidad y políticas de contenido; SD gana en personalización, LoRAs y ausencia de censura en ejecución local. Comparativa detallada imagen: /comparativas/midjourney-vs-flux. Guía instalación Flux local (patrón similar): /guias/como-instalar-usar-flux-gratis.

Limitaciones: estética general por debajo de Midjourney v7 sin fine-tuning dedicado. Tiempo de setup alto. Sin soporte enterprise ni indemnización legal como Adobe Firefly.

Precios — verificado 7 de julio de 2026 (platform.stability.ai/pricing): pesos SD 3.5 gratis open-source. API: Core 0,03 $, Medium 0,035 $, Large Turbo 0,04 $, Large 0,065 $, Ultra 0,08 $/img. Hardware propio se amortiza vs Midjourney en 6–12 meses con uso intensivo (>500 img/mes).

Workflow ComfyUI para SD 3.5 Large: descarga checkpoint desde huggingface.co/stabilityai; importa workflow JSON de la comunidad (OpenArt, CivitAI); ajusta KSampler steps 25–35, CFG 4–7 (SD 3.5 suele preferir CFG más bajo que SD1.5); usa Preview node para iterar sin escribir a disco. Guarda workflow versionado en git — reproducibilidad en equipo.

ControlNet en SD 3.5: descarga modelos controlnet compatibles (canny, depth, openpose); conéctalo con mapa de profundidad para producto en perspectiva correcta. Útil para e-commerce que parte de foto real de producto y genera variaciones de escena.

LoRA training con Kohya_ss: dataset 15–30 imágenes del sujeto, captions automáticos con BLIP, entrena 1–2 h en RTX 4090. Resultado: personaje o producto consistente en 100+ generaciones — imposible de replicar en Midjourney sin character reference manual.

Licencia y uso comercial: pesos Stability AI permiten uso comercial según license en repositorio — lee stability.ai/license para SD 3.5. No confundas con modelos community en CivitAI que pueden tener restricciones NC (non-commercial).

Stability API tiers: platform.stability.ai/pricing lista SD 3.5 Large, Large Turbo, Medium, Flash, Stable Image Core y Ultra — sin mención de SD4. Batch de 1.000 imágenes a 0,065 $ = 65 $ vs Midjourney Pro ~30 $/mes — SD API gana en control, Midjourney en simplicidad.

Troubleshooting VRAM: activa --lowvram en Automatic1111; usa tiled diffusion para outpainting; quantiza a FP8 en ComfyUI si tu GPU es 8 GB. Out of memory en SD 3.5 → baja resolución a 768×768 o usa API cloud puntual.

Comunidad y aprendizaje: r/StableDiffusion, YouTube ComfyUI workflows, documentación wiki.sdlegends — curva de aprendizaje 15–20 h hasta primer workflow productivo. Adobe Firefly (/herramienta/adobe-firefly) es alternativa si legal exige indemnización y no tienes GPU.

Para equipos de arte: documenta seed, sampler y LoRA weight en Notion por asset aprobado — meses después, reproducir el look sin metadata es imposible. SD 3.5 en enterprise suele convivir con Midjourney para concept y SD para variaciones batch local bajo NDA.

★★★★★

4.3/ 5.0

— Valoración editorial de IAUtiles

Basada en uso real y pruebas directas de la herramienta

Visitar Stable Diffusion 3.5

Open-sourceLoRAControlNetLocalStability AI

Ventajas

+SD 3.5 open-source — familia insignia confirmada por Stability AI (platform.stability.ai)
+LoRAs y ControlNet para control preciso de estilo, pose y composición
+Miles de checkpoints en CivitAI para cualquier estilo o marca
+Inpainting, outpainting e img2img con edición no destructiva
+Sin censura en ejecución local — control total del pipeline

Desventajas

–Curva de aprendizaje significativa — no apto para usuarios no técnicos
–Requiere GPU con al menos 8GB VRAM para el modelo completo
–Estética general por debajo de Midjourney v7 sin fine-tuning

Mejores usos de Stable Diffusion 3.5

Creación de datasets de imágenes para entrenamiento de modelos propios

Generación de contenido con estilos visuales de marca muy específicos

Producción de concept art para videojuegos con LoRAs especializados

Investigación y experimentación con arquitecturas de difusión

👤¿Para quién es ideal?

Artistas técnicos e ingenieros de ML que quieren control total sobre el proceso de generación, estudios de videojuegos y animación que necesitan estilo visual consistente mediante LoRAs de marca, investigadores que estudian modelos de difusión, y cualquier profesional que necesite generar imágenes a escala sin coste de API. No es la herramienta adecuada para creativos que buscan resultados rápidos sin configuración.

💰¿Vale la pena el plan Pro?

El modelo SD 3.5 es gratuito y open-source. Coste real: hardware (RTX 3080+ recomendada) o API Stability desde 0,03 $/img (Core) hasta 0,08 $/img (Ultra) según platform.stability.ai/pricing. RunDiffusion y Vast.ai alquilan GPU por hora. ROI hardware propio vs Midjourney: 6–12 meses con uso intensivo.

🚀Cómo empezar paso a paso

1Comprueba VRAM: necesitas ≥8 GB para SD 3.5 Large en 512×512; 12–16 GB para resoluciones altas con LoRAs
2Descarga ComfyUI desde github.com/comfyanonymous/ComfyUI e instala dependencias Python 3.10+
3Descarga pesos SD 3.5 Large desde huggingface.co/stabilityai → ComfyUI/models/checkpoints/
4Arranca ComfyUI (python main.py) y carga el workflow base txt2img; ajusta prompt positivo/negativo y steps (20-30)
5Instala un LoRA desde civitai.com en models/loras/ y conéctalo en el nodo Load LoRA del workflow
6Sin GPU local: crea cuenta en platform.stability.ai — SD 3.5 Large desde 0,065 $/img (6,5 créditos)

❓Preguntas frecuentes

¿Existe Stable Diffusion 4?

No según fuentes oficiales. A julio de 2026, platform.stability.ai/docs/release-notes no lista ningún SD4 — la familia vigente es SD 3.5 (Large, Large Turbo, Medium) y Stable Image Ultra en API. Rumores de SD4 en blogs de terceros no tienen respaldo de Stability AI.

¿SD 3.5 Large, Turbo o Medium?

Large (8B params) es el flagship open-weight con mejor calidad. Large Turbo genera en 4 steps — más rápido. Medium (2,5B) equilibra velocidad y calidad. En API: Stable Image Ultra usa SD 3.5 Large como motor (0,08 $/img).

¿Stable Diffusion es gratis?

Sí. Los pesos del modelo son open-source bajo licencia permisiva. Puedes ejecutarlo gratis en tu propio hardware. Los servicios en la nube (Stability AI API, Replicate) cobran por uso pero eliminan la necesidad de GPU propia.

¿Qué es un LoRA en Stable Diffusion?

Un LoRA (Low-Rank Adaptation) es un archivo pequeño que adapta el modelo base para generar un estilo, personaje o concepto específico. Permite resultados personalizados sin reentrenar el modelo completo.

¿Stable Diffusion o Midjourney?

Stable Diffusion ofrece control total, personalización con LoRAs y ejecución local sin coste recurrente. Midjourney ofrece mejor calidad artística out-of-the-box sin configuración técnica. Elige SD si quieres control; Midjourney si quieres resultados rápidos.

¿Qué GPU necesito para Stable Diffusion?

Mínimo 8 GB VRAM para generación básica en 512x512. Para SD 3.5 en resoluciones altas o con LoRAs múltiples, se recomiendan 12-16 GB VRAM (RTX 3060 12GB o superior).

🏆Veredicto final

Control / personalización

5/5

Calidad out-of-the-box

3.5/5

Coste a escala

5/5

Facilidad de uso

2/5

Ecosistema LoRA

5/5

Stable Diffusion deja de ser gratis cuando valoras tu tiempo: 20 h aprendiendo ComfyUI vs 20 $/mes de Midjourney. El cruce rentable está en volumen — un estudio de videojuegos que genera 2.000 assets/mes amortiza una RTX 4090 en menos de un año frente a API. Creativos que quieren un poster hoy sin tocar nodos siguen mejor en Flux o DALL-E; SD es inversión de infraestructura, no suscripción.