Yandex presenta "Shedevrum": una red neuronal para la creación de imágenes a partir de solicitudes de texto

El equipo de Yandex ha anunciado el prototipo de su propia red neuronal para la creación de imágenes basadas en las solicitudes de texto de los usuarios, lanzando una prueba beta pública.

La aplicación "Shedevrum" está disponible en dispositivos móviles Android e iOS.

Burj Khalifa abandonado cubierto de selva, primer plano. Ilustración: Yandex

La versión beta de "Shedevrum" 0.1.4 se puede descargar de forma gratuita en las tiendas de aplicaciones Google Play y App Store. Las descripciones se pueden hacer en ruso e inglés.

Cthulhu comiendo sandía. Ilustración: Yandex

Después de instalar la aplicación, los usuarios pueden ver imágenes y dar "me gusta". Para crear imágenes a partir de sus propias solicitudes, debe dejar una solicitud y esperar su aprobación. En el futuro, esta función estará disponible para todos los usuarios registrados.

Un caniche se zambulle en una piscina, como en la portada del álbum Nevermind. Ilustración: Yandex

La red neuronal crea imágenes utilizando un método de difusión en cascada: primero genera imágenes que coinciden con la solicitud y luego aumenta gradualmente su resolución y satura con detalles.

Para la prueba beta, la primera versión del modelo generativo se entrenó con 240 millones de ejemplos de imágenes con descripciones de texto. El entrenamiento continúa en un conjunto de datos de 500 millones de ejemplos, y la calidad de las imágenes mejorará gradualmente en futuras actualizaciones.