Сбер представил бета-версию нейросети нового поколения Kandinsky 4.0 Video. Сервис позволяет создавать реалистичные видеоролики на основе текстового описания или стартового кадра. Об этом сообщила пресс-служба компании.
Новая модель способна генерировать видеоряд продолжительностью до 12 секунд в разрешении HD (1280 x 720 пикселей) по любому текстовому описанию или произвольному стартовому кадру. Пользователи смогут создавать видео с различным соотношением сторон.
Важнейшими отличительными свойствами новой модели являются улучшенное визуальное качество — высокий контраст и чёткость кадров, выстраивание общей композиции сцены, и реалистичность движений генерируемых объектов. Добиться такого качества позволило уникальное сотрудничество научных и инженерных команд, которые вместе работали как над развитием архитектуры новой модели, так и над сбором и фильтрацией данных для обучения.
Кроме того, команда Kandinsky представила быструю версию под названием Kandinsky 4.0 Video Flash, которая генерирует видеоряд продолжительностью до 12 секунд в разрешении 480p (720 x 480 пикселей) всего за 15 секунд.
Первыми пользователи Kandinsky 4.0 Video станут художники, кинематографисты и дизайнеры. Ожидается, что в начале 2025 года нейросеть станет доступна для всех.
Ранее www1.ru сообщал, что нейросеть Kandinsky научили создавать видео на основе текста.
Читать материалы по теме:
«Спойлер»: нейросети Сбера Kandinsky, SymFormer, Салют и GigaChat написали трек и сняли клип
Сбер расширяет доступ к чат-боту GigaChat в Telegram для всех пользователей
От концепции до видео за несколько минут: Сбер представил бета-версию Kandinsky Video 1.1