Сбер представил нейросеть Kandinsky Video 4.0

Сбер представил бета-версию нейросети нового поколения Kandinsky 4.0 Video. Сервис позволяет создавать реалистичные видеоролики на основе текстового описания или стартового кадра. Об этом сообщила пресс-служба компании.

Источник изображения: Телеграм-канал «Сбер»

Новая модель способна генерировать видеоряд продолжительностью до 12 секунд в разрешении HD (1280 x 720 пикселей) по любому текстовому описанию или произвольному стартовому кадру. Пользователи смогут создавать видео с различным соотношением сторон.

Важнейшими отличительными свойствами новой модели являются улучшенное визуальное качество — высокий контраст и чёткость кадров, выстраивание общей композиции сцены, и реалистичность движений генерируемых объектов. Добиться такого качества позволило уникальное сотрудничество научных и инженерных команд, которые вместе работали как над развитием архитектуры новой модели, так и над сбором и фильтрацией данных для обучения.
Пресс-служба Сбербанка

Кроме того, команда Kandinsky представила быструю версию под названием Kandinsky 4.0 Video Flash, которая генерирует видеоряд продолжительностью до 12 секунд в разрешении 480p (720 x 480 пикселей) всего за 15 секунд.

Первыми пользователи Kandinsky 4.0 Video станут художники, кинематографисты и дизайнеры. Ожидается, что в начале 2025 года нейросеть станет доступна для всех.

Ранее www1.ru сообщал, что нейросеть Kandinsky научили создавать видео на основе текста.

Читать материалы по теме:

«Спойлер»: нейросети Сбера Kandinsky, SymFormer, Салют и GigaChat написали трек и сняли клип

Сбер расширяет доступ к чат-боту GigaChat в Telegram для всех пользователей

От концепции до видео за несколько минут: Сбер представил бета-версию Kandinsky Video 1.1