Sber presenta la red neuronal Kandinsky Video 4.0

A principios de 2025, el servicio estará disponible para todos

Sber ha presentado la versión beta de la red neuronal de nueva generación Kandinsky 4.0 Video. El servicio permite crear vídeos realistas basados en una descripción de texto o un fotograma inicial. Así lo informó el servicio de prensa de la compañía.

El nuevo modelo es capaz de generar secuencias de vídeo de hasta 12 segundos en resolución HD (1280 x 720 píxeles) a partir de cualquier descripción de texto o fotograma inicial arbitrario. Los usuarios podrán crear vídeos con diferentes relaciones de aspecto.

Las propiedades distintivas más importantes del nuevo modelo son la calidad visual mejorada: alto contraste y nitidez de los fotogramas, construcción de la composición general de la escena y realismo de los movimientos de los objetos generados. Esta calidad se logró gracias a la colaboración única de equipos científicos y de ingeniería, que trabajaron juntos tanto en el desarrollo de la arquitectura del nuevo modelo como en la recopilación y el filtrado de datos para el aprendizaje.
Servicio de prensa de Sberbank

Además, el equipo de Kandinsky presentó una versión rápida llamada Kandinsky 4.0 Video Flash, que genera secuencias de vídeo de hasta 12 segundos en resolución 480p (720 x 480 píxeles) en solo 15 segundos.

Los primeros usuarios de Kandinsky 4.0 Video serán artistas, cineastas y diseñadores. Se espera que a principios de 2025 la red neuronal esté disponible para todos.

Anteriormente, www1.ru informó que la red neuronal Kandinsky aprendió a crear vídeos basados en texto.

Leer materiales sobre el tema:

«Spoiler»: las redes neuronales de Sber, Kandinsky, SymFormer, Saliut y GigaChat escribieron una canción y grabaron un videoclip

Sber amplía el acceso al chatbot GigaChat en Telegram para todos los usuarios

De la concepción al vídeo en pocos minutos: Sber presenta la versión beta de Kandinsky Video 1.1