Stable Diffusion es un modelo de Inteligencia Artificial que genera imágenes digitales de alta calidad a partir de descripciones de texto formuladas en lenguaje natural.

Stable Diffusion ha sido creado por la empresa Stability AI y es de código abierto, lo cual representa la mayor diferencia respecto a otras herramientas populares para la creación de imágenes, como DALL-E o MidJourney. Además, también se ha entrenado con pares de imágenes y subtítulos extraídos de una base de datos de acceso público, LAION-5B.

La primera versión de Stable Diffusion se lanzó en el año 2022.

Cómo se usa Stable Difussion

Al tratarse de una herramienta de código abierto, su uso es libre. Y te permite, incluso, ver y descargar todo el código para configurar tu propia herramienta. La versión de software está bajo la licencia Creative ML OpenRail-M, que permite usar, cambiar o redistribuir el software modificado.

Independientemente de estas opciones de uso y personalización especializadas, las dos maneras más sencillas de usar Stable Difussion son accediendo a la url stablediffusionweb.com o a través de la web de Dream Studio (beta.dreamstudio.ai).

Ambas interfaces son sencillas e intuitivas y no requieren conocimientos técnicos. Una vez registrados como usuarios, se puede usar la herramienta directamente online.

Para solicitar imágenes, en la parte inferior de la pantalla aparece una barra de comandos en la que se escribe la petición. Para que se ejecute, pulsar en Dream.

También se pueden seleccionar opciones y ajustes varios (ancho, alto, número de imágenes). Si lo pregunta, lo recomendable es elegir siempre la última versión disponible de Stable Difussion.

Stable Difussion es gratuita de forma limitada; es decir, con cada solicitud se van consumiendo los créditos iniciales gratuitos y, una vez agotados, hay que pagar para continuar usando la herramienta.

Para qué sirve Stable Difussion

Stable Diffussion genera imágenes realistas, de alta calidad y resolución, para todo tipo de temas y estilos.

Utiliza tecnología de unidades de procesamiento gráfico (GPU), lo cual acelera y mejora las imágenes generadas y permite disponer de funcionalidades más concretas y avanzadas:

  • Traducciones

  • Conversiones de texto a imagen y de imagen a texto

  • Retoques y optimización de imágenes: añadir o suprimir objetos, zonas, colores...

  • Generación o modificación de imágenes a partir de otras imágenes

  • Edición de vídeos y animaciones

  • Creación de imágenes y composiciones con tu propia cara