Теперь умеет по-русски: Kandinsky Image научился генерировать изображения с надписями на кириллице

Нейросеть научилась писать без ошибок и на любых поверхностях

Сбер выпустил обновление модели генерации изображений Kandinsky, которая теперь умеет генерировать надписи на кириллице с учётом текстуры поверхностей.

Разработчики обучили нейросеть, используя более 10 миллионов изображений с русским текстом, написанным различными способами. Это позволило модели научиться различать печатные и прописные буквы.

Сначала Kandinsky обучался генерировать кириллический текст нативно, без использования дополнительных модулей, а потом его дообучили на экспертном датасете, тщательно отобранном и проверенном дизайнерами и художниками.

У новой модели все ещё возникают трудности в ряде категорий запросов — длинные надписи, надписи со смесью кириллицы и латиницы, подробное детальное описание сущности или фона могут получаться не с первого раза. Короткие запросы без указания фона, масштаба и ракурса получаются быстрее и качественней, но тут модель будет фантазировать сама, что, впрочем, часто только к лучшему.

Указание текстуры и освещения помогает создать интересные вариации надписей — камни, вода, лёд, стекло, мармелад, старая древесина, мох, лаковая кожа, глянцевый стол. Буквам можно добавить рельеф или объём. Для прозрачных фактур можно указать «контровой свет», «контражур» — буквы станут полупрозрачными. А для эффектности можно добавить дым или туман.

Потестировать модель самостоятельно уже можно в Telegram-боте Kandinsky и во всех ботах GigaChat (Telegram, ВКонтакте, Одноклассники, Max), а также в web-версии.

Мы тоже попробовали и результат нам понравился.

Читайте ещё материалы по теме:

11:03 Новости
ИИ «захватывает» интернет: до 30% трафика будут создавать сами нейросети Агенты начнут общаться друг с другом, а сети придётся перестраивать под новый поток данных
10:05 Новости
Сбои в электросетях найдут за секунды: ИИ меняет систему реагирования на аварии Нейросеть сама определяет причину неполадки и отправляет готовый отчёт без участия инженеров
09:47 Новости
Telegram теряет внимание: российские бренды фиксируют падение охватов Просмотры постов упали более чем на 20% при минимальном оттоке аудитории
08:28 Новости
Набиуллина расставила границы для ИИ: нейросети помогают ЦБ, но не решают за него Денежно-кредитная политика остаётся в зоне ответственности людей
24 апр 17:23 Новости
Экосистемы упёрлись в потолок: россияне начинают экономить на подписках Компании смещают фокус с роста базы на доход с пользователя
Источники:
Сбер

Сейчас на главной